语言和纠错码

思考与克劳德·香农的交流

克劳德·香农的独轮车在巴黎工艺美术博物馆展出。

伊芙琳·兰姆

加入我们的科学爱好者社区!

本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点


上周我去了巴黎的工艺美术博物馆,这是一个展出齿轮、发动机、原始傅科摆复制品以及各种机械装置的博物馆。在那里,我参观了关于克劳德·香农的临时展览,正如那里描述的那样,他是“代码魔术师”。香农是一位美国数学家和计算机科学家,被称为信息论之父。思考一个关于交流和代码的展览让我感到非常个人化。作为一个在巴黎学习法语的人,我每天都在吃力地解读那些对法国十岁孩子来说毫无难度的信息。

展览的一部分是一个互动视频显示器,它说明了纠错码的一般概念以及为什么要使用它。(我在七月份一篇关于高维球体堆积的文章中更详细地介绍了这个想法。)它展示了两个人试图交流一条信息:“Bonjour!”当信息在他们之间滑过屏幕时,视频游戏中的闪电击下来,改变了一些字母。当信息到达第二个人时,它看起来像“Bxtj!ur1。”接收者感到悲伤和困惑。场景结束。

然后,参观博物馆的人有机会通过更改消息传输的次数来帮助可怜的角色进行交流。如果你为消息的每个字母传输两个字母——也就是“BBoonnjjoouurr!!”—你就可以更容易地判断消息是否在传输过程中被更改了。两个都被更改的字母不太可能再次相同,所以例如,如果字母 1 和 2 匹配,那么它们很可能正确地传输过来了。如果你将消息重复三遍:“BBBooonnnjjjooouuurrr!!!”,你就有很大的机会能够纠正错误。如果三个字母中有两个匹配,你可以猜测它们是正确的。如果单词的每个字母的三个字母中有两个匹配,那么你的消息就完整地传输过来了。这意味着即使有 1/3 的字母被损坏,你仍然能够进行交流。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。


展览让您看到增加重复次数如何使正确的消息更可能被传输,但它也说明了等式的另一面:您重复消息的次数越多,传输所需的时间就越长。当我将重复次数增加到 5 次时,消息被正确传输了,但这花费了极其漫长的时间。

我必须承认,当我玩这个展览时,我对那些拼命想互相交谈的可怜的小人感到有点沮丧。重复三次,消息通常会传达过来,但有时一个字母最终变得无法使用,而且他们不会领会暗示。我的意思是,如果你收到了消息“Bonj4ur!”,我想你会明白这个人试图向你打招呼,对吧?搜索引擎和自动更正知道当我写“embarassed”时,我真正想表达的是“embarrassed”。为什么这些角色不能做得更好?那些愚蠢的小人顽固地抵制了我们自然而然地融入到语言中的纠错。

我对那些小人的沮丧情绪的讽刺意味并没有被我忽视。我正在学习法语,我可以用法语进行一些基本的交易——当我成功地在邮局买到正确数量的正确邮票时,我几乎要唱起歌来——但我经常茫然地盯着某人,而我的大脑试图处理他们所说的话。等到我理解了它,并且在我设法费力地组织好回复之前,他们已经切换到英语或完全无视我了。当我不诅咒自己的无知时,我在这里花了很多时间思考交流的本质。

我在法语交流中最大的障碍之一是,以我目前的水平,法语不像英语那样具有纠错能力。如果公共汽车或火车上有 PA 广播,如果是“Prochain arrêt”,后面跟着站名,我就会明白,但任何其他内容都可能完全被我忽略。嘈杂的英语广播通常不是问题,但我无法像纠正英语那样纠正法语,因此即使声音质量略有下降,消息也会变得难以理解。

在与其他人的一对一对话中,我仍然很难听到和注意到声音差异,这些差异向我传达了诸如数字之类的细微之处。“Le garçon”和“les garçons”对我来说很难在当场区分。幸运的是,动词结尾也编码了这些信息。在第三人称单数和复数动词形式之间存在明显声音差异的词语中,我可以使用它来弥补我听力方面的弱点。但并非每个动词在这两种形式之间都有声音变化,即使有,我也并不总是能正确地听到它。我比以法语为母语的人更可能混淆听起来相似的词,即使其中一个词在语境中根本没有意义。我错过了很多词语和语境——我不太容易注意到有人在谈论她的头发 (cheveux),而不是她的马 (chevaux)。

最令人惊讶的是,有时我会遇到相反的问题,而以法语为母语的人的内置纠错能力会破坏我试图表达我的观点的尝试。有一次我试图说我的配偶在城市的某个地方工作 (travailler)。他们解释说法语中的“旅行”实际上是“voyage”。另一次,我试图告诉别人我去过卡昂,诺曼底的一个小镇,他们纠正了我对戛纳的发音,戛纳是里维埃拉沿岸著名的电影目的地。一般来说,城市名称是危险的。我在里尔和里昂也遇到过同样的问题,几年前,一位德国人无法理解我想去科隆,直到我用它的英语(和法语)名称科隆称呼它。试图弥补我糟糕的发音和磕磕巴巴的句子结构的善意尝试有时最终会引入与它们纠正的错误一样多的错误。

有一些语言学家研究语言不同方面的冗余,以及计算机科学家将自然语言的纠错特性与机器学习和翻译联系起来。但我凭直觉体验到了这一点——我没有对我自己的法语纠错缺陷进行严格的研究。我还有动词变位需要练习。

© . All rights reserved.