自主计算

程序崩溃,人们犯错,网络增长和变化。这就是生活,计算机科学家最终正在构建可以应对这种情况的系统

计算机硬件的速度和容量每十年都以数千倍的速度增长;计算机软件也以几乎相同的速度堆积新功能和更精美的界面。那么,为什么计算机仍然在浪费我们的时间并让我们发疯?

在最近一项英国调查中,四分之一的25岁以下受访者表示他们踢过电脑或看到朋友这样做。而复杂的网络系统(几乎所有大型组织都在依赖)的成本现在主要不是由越来越便宜的硬件和软件决定,而是由能够保持系统正常运行的专家们不断上涨的薪水决定。根据加州大学伯克利分校的研究人员在2002年3月发表的一项研究,人工成本超出设备成本3到18倍,具体取决于系统的类型。总预算的三分之一到一半用于预防或从崩溃中恢复。难怪:经纪公司或信用卡授权中心的系统故障可能会导致每小时数百万美元的业务损失。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的有影响力的故事的未来。


计算机危机

“今天在三个领域存在危机:成本、可用性和用户体验,”IBM阿尔马登研究实验室主任罗伯特·莫里斯说。在上个月在加州阿尔马登举行的一次会议上,来自大多数大型计算机公司和几所大学的研究领导者就IBM去年10月发布的“宣言”中概述的问题达成了一致。“IT基础设施日益增长的复杂性威胁着要破坏信息技术旨在提供的益处,”匿名撰写的宣言断言。计算机设备的数量预计将以每年38%的复合率增长;这些设备中的大多数将相互连接并连接到互联网。“到目前为止,我们主要依靠人工干预和管理来应对这种复杂性,”宣言继续说。“不幸的是,我们开始让事情变得一团糟。”

对于解决方案,意见分歧较多。IBM在其论文中认为,目标应该是“自主”计算机系统,类似于允许人体应对环境变化、外部攻击和内部故障的非自愿神经系统。“我们的身体具有很高的可用性,”莫里斯观察到。“我一直都有软错误:我的记忆偶尔会失效,但我不会‘崩溃’。当我割伤手指时,我的整个身体不会关闭。”

莫里斯和IBM自主计算研究工作的其他负责人不仅仅考虑容错。该宣言列出了自主计算系统的八个定义特征(右侧)。其中一些已经在原型中得到证明。

例如,自主系统必须具有自我意识。它必须跟踪它的各个部分,其中一些部分可能从其他系统借用或借出给其他系统。它还必须将其公共部分和私有部分分开。在哥伦比亚大学,盖尔·凯泽和编程系统实验室的同事已经研究出如何向某些类型的现有系统添加软件探针、仪表和配置控制,以便可以自动监控、调整甚至修复它们,而不是由高薪工程师进行。

自主系统还应该能够治愈,通过某种非自杀性崩溃的方式从损坏中恢复。斯坦福大学的阿曼多·福克斯及其同事已经演示了一种实现此目的的方法。福克斯重新设计了一个卫星地面站系统,以便每个子系统在被离线时都可以独立重启。系统仍然偶尔会宕机,但现在它可以在六秒钟内恢复运行,而不是30秒。同样的原理,称为递归可重启性,可以应用于多种复杂系统,以防止小故障累积并级联成全面停机。

可能的解决方案


自主系统的特征

(正如IBM所见)
  • 具有自我意识。
  • 适应其环境的变化。
  • 努力提高其性能。
  • 在损坏时进行修复。
  • 防御攻击者。
  • 与不熟悉的系统交换资源。
  • 通过开放标准进行通信。
  • 预测用户的行为。

  • 实验系统

    Oc¿ano是IBM托马斯·J·沃森研究中心正在构建的一个实验性自主系统,它包括前两个特征以及第三个特征:它积极地努力提高其性能。Oc¿ano使用优化算法来管理服务器的复杂结构,以找出分配任务的最佳方式和存储数据的最便宜的地方。它试图预测需求,并在需要之前让其命令下的计算机做好准备。

    惠普实验室的研究人员正在进行类似的项目,他们将其称为行星计算。在加州大学伯克利分校,热门词是“面向恢复的计算”,或ROC(如“坚如磐石”)。但是,伯克利小组的戴维·帕特森和其他人并不完全认可计算机系统将其所有复杂操作对人类操作员隐藏起来的想法。对于帕特森来说,目标不是构建HAL 9000,其不可预测的行为只能通过拔掉插头来停止,而是模仿星舰企业号的计算机,其内部仍然可以被工程师访问和理解。

    作为面向恢复的计算的一个例子,伯克利小组构建了一个具有“撤消”功能的原型电子邮件系统。该程序围绕着标准的电子邮件服务器,并记录其所有活动以及对其配置所做的任何更改。如果管理员不小心删除了用户的邮箱,或者设置了一个将好邮件与垃圾邮件一起丢弃的过滤器,或者病毒传播并开始随意发送邮件,则操作员可以通过将系统“回溯”到较早的时间点来还原服务器及其所有邮件,修复错误,然后以快速方式“重播”事件。这种方法会消耗大量磁盘空间。例如,对于帕特森部门的1,270个用户,该系统一年将使用三个120千兆字节的磁盘。但是,现在磁盘非常便宜(在伯克利的情况下每个180美元),因此好处很容易证明成本的合理性。

    这或许是计算机科学家们重新认识到大多数计算机系统有多么不稳定的真正意义。在过去的30年中,该领域的座右铭是更快、更大、更便宜。慢慢地,最终,目标可能会转变为更简单、更可靠和更不值得被踢。

    相关链接

    文章

    全球计算机

    语义网

    美丽新操作系统

    计算机,自我修复

    IBM引领整体计算

    项目页面

    戴维·帕特森的网页

    IBM的eLiza项目

    IBM关于自主计算的页面

    加州大学伯克利分校Oceanstore项目

    UMBC eBiquity小组

    斯坦福软件基础设施小组

    伯克利/斯坦福面向恢复的计算项目

    © . All rights reserved.