计算的未来(大约 1999 年)

麻省理工学院的计算机科学实验室正在开发一种新的信息技术基础设施——氧气系统——该系统有望实现该实验室主任长期以来的愿景:通过少做来帮助人们做得更多

编者按:这篇文章最初发表在 1999 年 8 月的《大众科学》杂志上,现在重新刊登,是为了庆祝欧洲核子研究中心在 3 月 13 日庆祝蒂姆·伯纳斯-李最初提出万维网 20 周年

去年,我们麻省理工学院计算机科学实验室的几个人飞往台湾。我花了大约三个小时,试图让我的新笔记本电脑与一个用于下载日历的插卡一起工作。但是,当卡软件正常工作时,操作系统却出现了问题,反之亦然。沮丧之下,我转向坐在我旁边的蒂姆·伯纳斯-李,他很乐意提供帮助。然而,一个小时后,这位万维网的发明者承认这项任务超出了他的能力范围。

接下来,我请 RSA 公钥加密技术的共同发明者罗纳德·李维斯特帮忙。他展现了他的智慧,礼貌地拒绝了。这时,我们最年轻的一位教员站了出来:“你们都太老了。让我来。” 但是,一个半小时后,他也放弃了。于是我回到我的“专家”方法,在屏幕上不断弹出的各种向导和蜥蜴中随意输入内容,直到纯粹偶然,三个小时后我才成功了。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保未来能够有关于塑造我们当今世界的发现和想法的具有影响力的故事。


这种痛苦的经历很典型,也提出了一个重要的问题:在计算机科学的头 40 年里,我们一直专注于迎合机器的需求。我们单独设计系统和子系统,然后将它们推向公众,期望人们将不同的组件协同工作。这种方法给我的印象是,设计一辆汽车,其中驾驶员必须转动数十个单独的旋钮来控制燃油混合物、火花提前和气门间隙等——而他所想做的只是从一个地方到另一个地方。

通过少做来做得更多 我们已经做了足够多的这种设计了。现在是我们改变以机器为导向的思维方式,为信息时代的人们发明方向盘、油门和刹车的时候了。这个想法让我直接回到了我近期愿景的目标:人们应该能够利用新的信息技术,通过少做来做得更多。 当我说“通过少做来做得更多”时,我的意思是三件事。首先,我们必须将新技术引入我们的生活,而不是相反。如果我们离开现在的生活,戴上护目镜和紧身衣,进入某种充满千兆字节的金属网络空间,我们就不会取得更多成就。当工业革命到来时,我们并没有进入汽车空间。汽车作为冰箱来储存我们的食物,作为汽车来运输我们。我期望计算机和通信也会发生这种转变:它们将进入我们的生活,它们的身份将与它们执行的有用的任务同义。

其次,新技术必须提高人类的生产力和易用性。想象一下,如果我可以拿出一个手持设备,然后说“本周末带我们去雅典。” 我的电脑会连接到 EasySabre 航空公司预订系统,并开始与它交互,使用旅行社使用的相同命令。机器会知道“我们”是两个人,并且我们喜欢商务舱、靠过道的座位等等。它会与航空公司电脑协商大约 10 分钟,直到找到可以接受的航班并确认。我只花了三秒钟发出订单,而我的电子推土机(手持设备的软件)会工作 10 分钟,即 600 秒。在这个例子中,人类生产力的提高是 600 除以 3,即 200,或者用商业术语来说,是 20,000%。

当然,这种巨大的收益不可能在所有地方实现。但是在 21 世纪,我预计我们可以通过自动化日常办公活动,并将大脑和眼球工作转移到我们的电子推土机上,从而将人类生产力提高 300%。这种转变将以我们在工业革命期间将体力劳动转移到推土机上的方式发生。我们尚未开始从信息革命中看到这些收益。现在,我们点击浏览器或电子邮件屏幕,眯着眼睛,挤压着大脑。本质上,我们仍然在“铲土”,但我们没有注意到,因为我们拿着镶着钻石的铲子,上面印着“高科技”的字样。因此,如果我们想要一场真正的革命,我们对计算机能为我们做的事情的期望也必须改变。

到目前为止,计算机供应商滥用了“易用性”一词。当他们称一个系统用户友好时,这无异于给一只黑猩猩穿上手术服,并认真地把它当做外科医生一样到处炫耀。当我说“易用性”时,我不是指将更多颜色和漂浮的动物融入我们的系统中。我的意思是真正的易用性,即使交互仅通过文本进行。我无法想象浏览器和操作系统之间的差异会持续超过几年。两者都访问信息——一个在远处,一个在本地——并且因为人们需要使用信息做同样的事情,无论信息驻留在哪里,易用性要求我们只有一个命令集来处理两者。目前的情况就像您的方向盘在城市街道上转动您的汽车,但在乡下踩下刹车一样荒谬。

新技术使人们通过少做来做得更多的最后一种方式是将“人”这个词包括在每个人中。如今有大约 1 亿台机器互连,我们感觉非常自满。然而,这个数字仅占世界人口的 1.6%。我们认为世界正在广泛地进行交流,但我们仍然只能通过电视和政府信息来听到数十亿人的声音。此外,信息革命,如果任其发展,只会扩大贫富差距,因为富人会利用他们的机器变得更有生产力,从而变得更富有,而穷人则原地踏步。

我们不能让这种情况发生——如果不是为了利他主义,那就是为了自我保护。这种差异必然会导致血腥冲突。如果我们决定提供帮助,那么潜力是巨大的:富人可以利用新的信息世界向穷人购买服务和产品,就像早期制造业所做的那样。虚拟同情军团可以有史以来第一次将提供人力帮助的人与全世界需要帮助的人进行匹配。事实上,麻省理工学院计算机科学实验室的一小群本科生已经建立了一个网站 (www.compassioncorps.org) 来专门做这件事。而且帮助并不总是必须从发达世界流向发展中世界。想象一下,斯里兰卡的一位医生每天赚 20 美元,通过一个配备远程视频和医疗器械连接并由护士驻守的亭子,向波士顿的无家可归者提供医疗保健服务。这项服务的费用可能每次访问 5 美元,虽然并不完美,但总比没有医疗保健要好。

这就是我所说的,人们应该能够通过少做来做得更多:将技术引入我们的生活,提高人类的生产力和易用性,并将这些收益提供给所有人。鉴于这个目标,让我们看看这个愿景所扩展的计算模型。

信息市场
我对近期信息世界的模型与我过去 20 年来谈论的模型相同——信息市场,其全部功能尚未实现。在未来十年里,将有 5 亿台人工操作的机器和无数计算机(以电器、传感器、控制器等形式)互连。这些机器及其用户将做三件事:购买、出售和自由交换信息和信息服务。如今,互联网上的交易额约为 500 亿美元。到 2030 年,我估计这一流量将达到 4 万亿美元(按今天的美元计算),或相当于世界工业经济的四分之一。它将主要来自占整体经济一半的办公部门。事实上,未来信息服务的大部分将涉及一种新的活动——购买和出售信息工作。想象一下,来自北京的 1000 名会计师以每小时 1 美元的价格为通用汽车公司提供会计服务。

信息市场中的“自由交换”部分也同样重要。它将通过家庭信息;协作活动;知识构建和访问能力;政治、文学和社会交流;以及许多新的活动来影响我们的生活。

鉴于通过少做来做得更多的目标和信息市场的模型,我们如何在实践中实现这一目标?为此,在计算机科学实验室,我们刚刚启动了一个重要的研究项目。我们期望它能产生一个全新的硬件和软件系统,称为氧气,该系统将为人们及其应用量身定制,并将像我们呼吸的空气一样无处不在——我们希望如此。这项耗资数百万美元、为期五年的项目涉及计算机科学实验室的约 30 名教员,他们与麻省理工学院人工智能实验室合作。

设计氧气
氧气系统的核心是 Handy 21,它类似于手机,但还具有可视显示器、摄像头、红外探测器和计算机。Handy 21 将您需要的帮助带到您所在的地方。此外,它是全软件可配置的,因为它可以在任何国家,通过翻转一个比特,从手机变为与其他 Handy 21 通话的双向无线电,变为高速无线办公网络附近的网络节点,或变为普通的 FM 收音机。Anant Agarwal 在第 60 页的文章和 John V. Guttag 在第 58 页的文章讨论了氧气的这一方面。

氧气的第二个关键技术是 Enviro 21。与跟随人们的 Handy 不同,此设备连接到人们周围的环境。它内置在您的办公室和房屋的墙壁以及您汽车的后备箱中。Enviro 21 与 Handy 21 的关系类似于电源插座与电池的关系。它完成 Handy 21 所做的一切,但容量和速度更高。Enviro 21 也可设置为调节各种设备和电器,包括传感器、控制器、电话、传真机以及摄像头或麦克风阵列。

氧气通过两种方式与无生命的物理世界交互——通过这些可控电器以及 Handy 21 中的红外探测器。如果门对您的机器感兴趣,您可以在其上粘贴一个红外标签。此后,当人们将他们的 Handy 21 指向该门时,机器会读取该门的身份并显示它后面应该是什么。换句话说,该系统提供了一种 X 光视觉,帮助人们与他们环境中感兴趣的物理对象建立联系。

Handy 21s 和 Enviro 21s 将通过一种新型网络 Net 21 连接。它的主要功能是在希望聚集在一起的 Oxygen 用户之间创建一个安全的“协作”区域,无论他们身在何处。Net 21 必须在嘈杂庞大的互联网之上实现这一目标。它必须能够处理参与节点的聚合上升和崩溃带来的持续变化。它必须找到您所在的位置。它必须连接到众多设备。并且它必须连接到全球网络。这不是一项容易的任务。Oxygen 将需要一种全新的网络协议方法,这种方法利用自组织和自适应,并增强当今的互联网。

Oxygen 还必须涉及感知资源,特别是语音理解,并解决人们天生的自然交流需求:我们不是天生就带有键盘和鼠标插座,而是带有嘴、耳朵和眼睛。在 Oxygen 中,语音理解是内置的——系统和应用程序的所有部分都将使用语音。Victor Zue 及其团队构建的系统可以处理狭窄的查询领域,例如天气或航空公司。我们正在将这些狭窄的领域缝合在一起——并在需要时加入视觉和图形——以形成一张覆盖更广泛的人机通信的新面貌。

Oxygen 的第五项技术涉及人们查找有用信息的需求。我们正在设计 Oxygen,以便您首先以您熟悉的方式检查自己的知识存储。该系统将允许您简单地说“把一个月前来的那个大的红色文档给我”,而无需参考编号和其他线索。Oxygen 还将检查同意与您共享知识的朋友和同事的存储,就像如果您自己不知道答案,可能会问朋友或同事问题一样。最后,Oxygen 将搜索 Web 上的大量信息存储并进行“三角定位”,将它在那里找到的信息与您和您的同事存储的知识库联系起来。

Oxygen 还将让人们将例行和重复性工作卸载到他们的电子推土机上。它将帮助用户编写脚本以自动化各种工作,以及监视和控制连接到 Enviro 21s 的许多设备。“调高温度。”“在那里打印。”“每天中午,给我我的投资组合的价格和雅典的天气。” Oxygen 将使用推理和控制循环来处理这些指令,该循环允许人们在机器执行自动化任务时对其进行温和指导。

该系统的协作技术将帮助人们在前进的过程中跟踪他们的所作所为。例如,该系统将保留会议的超链接摘要,该摘要由人类秘书在语音理解注释的帮助下提供。当您询问关于新建筑的玻璃屋顶的决定时,它会给您秘书的三个字总结——“我们取消了它”——但如果您愿意,它也会让您深入探究导致该结论的口语和视频输入的链条。

最后,Oxygen 将包括定制技术,该技术可根据个人需求定制信息。将不会有收缩包装的软件。所有软件都将从 Net 21 网络下载到 Handy 21s 和 Enviro 21s 上,由用户请求、错误或升级触发。定制技术还将允许人们在使用其他 Oxygen 技术时,根据自己的需求和习惯调整周围的机器。

一项主张和一个愿望 Oxygen 是八项新技术的集成集合:手持设备、墙壁和中继计算机、新型网络、内置语音理解、知识访问、协作、自动化和定制。Oxygen 的力量不在于任何一个部分,而在于这些以人为本的技术的整体。它们形成了一种新的计算隐喻,我们希望它标志着从今天桌面和图标的重要转变,就像那些创新从纯文本系统转变一样。

我现在要提出更大的主张:我认为语音(和其他感知能力)、知识访问、自动化、协作和定制这五项技术是新出现的。在我们可以在新的信息世界中想象做的数千件事中,这五项是任何新活动的基础,这些活动将帮助我们通过少做来做得更多。至少在未来几十年里,它们是我们寻求的方向盘、油门和刹车,以及导致全面信息市场的力量。

如果这一主张有效,则表明希望利用信息新世界的人们应该探索新的 Oxygen 技术的能力。每个个人和组织都将可以访问它们。那些真正通过少做来做得更多的人将是那些学会如何将这些技术及其人员整合到一个运转良好、嗡嗡作响的整体中的人。好的 Oxygen 应用程序利用语音、知识访问、自动化、协作和定制,将使人们更容易充分发挥其潜力。想象一下建立在 Oxygen 之上的医疗保健应用程序:对于知识访问,它可能会使用 Medline(美国国家医学图书馆提供的可搜索的在线医学期刊文章数据库)和医院的患者记录,两者都可以通过语音获得。它可以自动化例行的医疗和行政任务,帮助医生相互协作,等等,从底层 Oxygen 系统的功能中获取其应用程序的“个性”。

我希望这种体现在 Oxygen 和其他类似系统中的愿景,将帮助我们摆脱对机器的 40 年的关注,进入以人为本的计算新时代。当我们越来越关注人类需求时,也许我们可以对未来提出更大的愿望。前三次社会经济革命都基于事物——农业革命的犁、工业革命的发动机和信息革命的计算机。也许现在是世界考虑第四次革命的时候了,这场革命不再针对物体,而是针对理解地球上最宝贵的资源——我们自己。

© . All rights reserved.