大型强子对撞机如何改变互联网

大型强子对撞机计算网格可能会教会互联网如何静默地处理大量信息

今年秋天,当大型强子对撞机(LHC)开始在其位于瑞士日内瓦附近、周长17英里(27公里)的地下粒子轨道内将质子撞击在一起时,它不仅会开启物理学的新时代,也会开启计算的新时代。

预计在今年年底之前,大型强子对撞机将开始喷涌出相当于每五秒钟一张DVD(五千兆字节)的原始数据海啸。它每年15拍字节(1500万千兆字节)的输出量将很快超过历史上任何其他科学实验的输出量。

挑战在于如何让世界任何地方的科学家都可以在她的笔记本电脑上执行几个命令即可访问这些数据。解决方案是一个名为大型强子对撞机计算网格的全球计算机网络,如果一切顺利,它可能会让我们一窥未来互联网的模样。


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将有助于确保未来关于塑造我们当今世界的发现和想法的有影响力的故事。


一旦大型强子对撞机在明年某个时候达到满负荷运转,它将每秒钟产生数百张粒子碰撞的快照,这些快照由四个位于地下、高一米半到八层的探测器捕获。* 网格的任务是找到极其罕见的事件——这里缺少一点能量,那里有一组粒子的模式——这些事件可以解决诸如质量的起源或暗物质的本质等悬而未决的谜团。

早一代,欧洲核子研究组织(CERN)的研究员蒂姆·伯纳斯-李着手创建一个全球性的“信息池”,以应对类似的挑战。当时和现在一样,来自全球各地的数百名合作者都在努力掌握欧洲核子研究组织实验中快速发展的数据。伯纳斯-李的解决方案成为了万维网。

但是,大型强子对撞机的数据洪流需要特殊处理。“如果我看看大型强子对撞机及其为未来所做的事情,”佐治亚理工学院高性能计算执行主任大卫·贝德说,“万维网未能做到的一件事是管理大量的海量数据。”仅带宽就是一个主要的瓶颈。贝德说,对于运行超级计算机模拟的研究人员来说,将数据写入太字节硬盘并通过联邦快递将其从一个超级计算机中心运送到另一个中心,比通过网络传输庞大的数据集更便宜。

大型强子对撞机计算网格分阶段处理数据,称为层。“第0层”位于欧洲核子研究组织,是一个由10万个当今最快CPU组成的超并行计算机网络,用于存储和管理来自实验的原始数据(1和0)。它通过专用的每秒10千兆比特的光纤线路将部分数据发送到北美、亚洲和欧洲的11个“第1层”站点。例如,纽约州阿普顿的布鲁克海文国家实验室接收来自ALICE实验的数据,该实验使铅离子发生碰撞。

从这些站点,数据被分发到全球大学、政府实验室甚至私营公司的140个第2层计算机网络中,以便更轻松地访问。第2层是科学家实际访问数据并执行将原始1和0转换为粒子能量和轨迹所需的各种实际数值分析的地方。

日内瓦欧洲核子研究组织信息技术(IT)部门的项目负责人伊恩·伯德说,使数据可访问的关键要素是一种称为“中间件”的软件。用户想要的信息可能分散在不同服务器上的拍字节数据中,并以不同的格式存储。一个名为Globus的开源中间件平台旨在无缝地收集该信息,就好像它位于用户自己的台式电脑的文件夹中一样。

大型强子对撞机程序员将对Globus进行的严峻考验——以及由此产生的修改——可能是大型强子对撞机网格的第一个实际成果。如果项目科学家能够在粒子物理学中驯服大规模的全球网络数据和计算周期,他们的解决方案很可能会应用于整个互联网——就像伯纳斯-李的专门HTML发明演变成现代科技社会的支柱一样。

贝德设想未来的中间件允许家用计算机通过访问附近环境传感器的信息来提供即时天气预报。或者它可能有助于筛选一生积累的个人医疗记录或多年的家庭录像,寻找隐约记得的事件。

具有讽刺意味的是,欧洲核子研究组织对互联网的下一个重大贡献可能对最终用户来说几乎是透明的。在一个完美的世界中,Globus 或其继任者将简单地使给定网格上的所有内容都可以从任何计算机直接且透明地访问。“如果 Globus 获得成功,”贝德说,“那么你就不会听到关于它的消息。”

*更正(2008年9月3日):本文最初指出,大型强子对撞机将产生数百万张粒子碰撞的快照;“数百万”指的是碰撞次数,只有一部分会被记录下来。

© . All rights reserved.