智能手机如何扼杀打字——却开启了人工智能革命

为了找到更好的屏幕键盘而展开的竞赛,催生了机器理解我们的新方法

加入我们的科学爱好者社区!

史蒂夫·乔布斯经常逆流而上,反对普遍的观点。(“你不可能做出没有两个按钮的鼠标!”“你不可能做出没有软盘驱动器的电脑!”“你不可能做出没有可更换电池的手机!”)事实证明,他很多次都是对的。

然而,偶尔,他的决定也把行业带入了尴尬的方向,我们从未真正从中恢复过来。例如,乔布斯固执地认为手机不应该有任何按键。iPhone 成为了一款热门产品,它催生了模仿者,剩下的就是历史(或者说是未来,这取决于你如何看待它)。

取消键盘有它的好处。它为手机屏幕留出了更多空间——用于照片、电影、地图和阅读材料。只有一项活动真正受到了影响:输入文本。


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


第一代 iPhone 提供了一个屏幕键盘。正如乔布斯指出的那样,它的优点是可以在不需要时消失。它还可以在瞬间更改语言或字母表。

但其核心问题是,与使用物理键盘(如 BlackBerry 的键盘)相比,在玻璃上打字速度慢且令人不满意。当代智能手机的历史一直是七年来解决这个问题的探索。

最初的 iPhone 尝试用两种微小的方式来帮助解决这个问题,这两种方式至今仍在发挥作用。首先,屏幕上的按键会根据概率改变大小(不是视觉上,而是在后台)。

其次,有自动完成功能:无数诅咒的制造者,许多笑料的来源,但通常也很有帮助。

下一个重大突破是预测文本。您会在键盘正上方看到三个单词——从统计学上讲,这些单词是您最有可能接下来输入的。当手机预测正确时,您会感到一丝快乐。您输入“the best”(最好的),手机会提供“thing”(东西),然后是“about”(关于)。另一方面,预测文本也带来了自身的挫败感——例如,当软件没有捕捉到您的意图时。

这些预测算法会随着时间的推移而学习。它们可以避免很多错误。但它们不是最终解决方案。它们迫使您在打字时在按键和建议之间分散注意力,这会降低您的速度。

那么语音识别呢?难道这不是完美的解决方案吗?

并非如此。众所周知,手机听写远非完美;您必须手动更正错误转录的内容。当然,这是一项难以完善的技术——人们有数百万种不同的口音和方言,而且您是通过连接将他们的话语传输到远程服务器,这些服务器会将低保真音频转换为文本。

即使准确率能达到台式电脑的水平——当您在安静的房间里,戴着耳机麦克风时——您仍然偶尔需要键盘。“Bookmark it”(将其加入书签)听起来像“book market”(图书市场);“the right or left”(右边或左边)听起来像“the writer left”(作者离开了)。您的手机算法如何知道您想要哪个?

因此,世界各地的工程师都在不断攻克手机打字问题。他们为流行的手机开发了替代的屏幕键盘。例如,Swype 和 SwiftKey 允许您草率而快速地在按键上拖动手指,瞄准您想要的字母。

解决文本输入问题的尝试数量之多暗示了一个更大的真相:没有明显的完美解决方案。只有不同的优缺点组合。

我们可以从以下事实中获得安慰:听写、预测和自动完成解决方案每年都在改进。(例如,iOS 8 的预测文本按钮上的单词选择试图反映您在不同上下文中的风格——例如,给朋友发短信与给老板发电子邮件——并预测您可能更喜欢使用的单词。)但是,没有物理键盘的文本输入可能是一种后退的视界:无论我们走多远,我们永远也无法真正到达终点线。

再说一遍,我们做出牺牲是有充分理由的:为了给自己一个大的、友好的屏幕,来展示我们手机所做的其他一切。对于我们大多数人来说,这是一项值得做的权衡。

大众科学 ONLINE(大众科学在线)
最佳智能手机键盘应用程序:ScientificAmerican.com/dec2014/pogue

大卫·波格是雅虎科技的首席专栏作家,也是 PBS NOVA 迷你剧的几部的主持人。

更多作者:大卫·波格
大众科学 Magazine Vol 311 Issue 6本文最初以“Unpredictive Text(不可预测的文本)”为标题发表在大众科学 Magazine(大众科学杂志) 第 311 卷第 6 期(),第 38 页
doi:10.1038/scientificamerican1214-38
© . All rights reserved.