愿景:预测文本

加入我们的科学爱好者社区!

本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定反映《大众科学》的观点


在“愿景”系列中,关于最新研究的科幻小说将与分析相结合,探究虚构背后的事实。目标是将来源于头条新闻的科幻小说与对新发现暗示的可能性的分析相结合。

搜索引擎的发言人带领记者们走下公司位于密苏里州的巨型服务器农场的通道。

“长期以来,我们一直在跟踪搜索查询的趋势,这为科学家提供了对流感活动以及其他方面的见解,”当计算机在他周围静静地嗡嗡作响时,他说道。“我们还尝试过根据公开数据生成计算机生成的新闻报道。”


关于支持科学新闻业

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻业 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和思想的具有影响力的故事。


“现在,这是我们最新的发展,”他挥舞着手臂,夸张地说。“我们称之为先期日报。根据任何给定时刻最流行的搜索查询,我们弄清楚人们可能最想了解哪些新闻的更新,并根据我们在新闻和其他我们挖掘的数据库中看到的趋势,‘先期日报’会自动生成关于接下来可能发生什么的故事。”

短暂的震惊沉默之后,体育和商业记者同时脱口而出地问道:“这些故事有多准确?” 其中一个记者想象着体育比分在比赛发生之前就出现,另一个记者则想象着股票价格。

“哦,它们通常完全不准确,”发言人轻笑着说。“或者更确切地说,‘先期日报’通常会生成多个故事,每个故事对应它看到的每一种可能的未来。它根据每个故事的可能性对其进行排名,但当然,即使是不太可能发生的事件有时也会发生。”

看到记者们脸上困惑的表情,发言人解释说:“‘先期日报’的想法不是像人们可能认为的那样预测未来,而是帮助用户为最有可能的未来做好准备,就像导演在拍摄电影前经常进行的故事板预演一样。它可以帮助人们思考他们现在可能想搜索什么,以帮助了解未来可能会发生什么。广告商也可以通过迎合潜在的未来需求而受益。如果你往这边来,我可以给你展示我的意思……”

稍后,发言人一屁股坐在公司总裁办公室的沙发上。

“那么他们怎么看?” 总裁问道。

“哦,他们似乎相信了,”发言人说着,从手中的波旁威士忌中喝了一口。

“这就是‘先期日报’预测的,”总裁同意道。

发言人轻笑了一声,然后皱起眉头叹了口气。“它现在能预测多远?” 他问道。

“现在?不到一天,”总裁靠在椅子上回答道。“再多就需要比我们目前拥有的服务器还要多的服务器,呈指数级增长。不过,这已经足够好了。‘先期日报’至今还没有出错。”

发言人歪着头打量着总裁。“你知道,总有一天,‘先期日报’会出错的。而且会错得很离谱。所有理论家都这么说。”

“哦,我毫不怀疑,毫不怀疑,”总裁说道。然而,他说这句话时,语气中流露出的怀疑是显而易见的。

***

科学家们越来越多地挖掘谷歌和推特以获取有价值的数据。尽管后者可能经常看起来微不足道,但现在每天发布的推文数量之庞大——根据 9 月份的统计数据,平均每天 2.3 亿条——使研究人员能够挖掘出对人类行为的深刻见解,例如情绪的全球模式,正如上周的一篇论文所证明的那样。

搜索引擎也使用预测文本来弄清楚用户可能输入哪些查询。当然,预测文本远非总是准确的——喜剧网站 Damn You Auto Correct! 创建了一个小型产业,专门收集 iPhone 自动更正错误中特别可笑的例子。

记者在预测未来方面通常也好不到哪里去。除了臭名昭著的“杜威击败杜鲁门”的失误——在 1948 年总统选举中,美国现任总统哈里·杜鲁门实际上以出人意料的胜利击败了共和党挑战者托马斯·杜威——报纸仍然在犯这种预先写作的错误,《每日邮报》最近错误地宣布阿曼达·诺克斯被判有罪。

谁知道现在正在进行的所有数据和数字运算在未来可能会导致什么? 尽管如此,对于计算机或其他方式做出的任何预测,我都会持非常怀疑的态度

您可以通过电子邮件 toohardforscience@gmail.com 就“愿景”系列与我联系。

Charles Q. Choi is a frequent contributor to 大众科学. His work has also appeared in The New York Times, Science, Nature, Wired, and LiveScience, among others. In his spare time, he has traveled to all seven continents.

More by Charles Q. Choi
© . All rights reserved.