CERN 为更多原子对撞升级其计算机

当大型强子对撞机在几周后重新上线时,CERN 的 IT 系统必须具有灵活性,以便处理涌入的大量信息


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。 通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


本月晚些时候,大量高能物理数据将涌向瑞士日内瓦的服务器。 这是因为欧洲核子研究中心 (CERN) 现在表示,它计划重启其大型强子对撞机 (LHC),以便进行可能持续长达两年的运行,对撞能量为 7 TeV(万亿电子伏特,每束束流 3.5 TeV)。 随着 CERN 将世界上最强大的粒子加速器提升到远超其先前最佳性能的水平运行,实验室的计算机系统也必须进行调整,以便它们能够正确捕获和分析所有这些新输出。

CERN 没有增加大量的计算机,并且可能过度扩展信息技术基础设施的电力和冷却能力,而是正在测试一种虚拟化服务器环境,它希望在年底前到位。 服务器虚拟化是一种近年来流行的技术,它涉及使用软件来分割服务器机器的处理和存储能力,以便更好地利用未充分利用的机器并提高数据中心的效率。

CERN 计划在年底前将其 4,000 台服务器(运行约 32,500 个处理器)划分为约 35,000 台虚拟服务器,并借助安大略省万锦市 Platform Computing Corp. 的软件管理后续工作流程。 在未来两三年内,该实验室可能会进一步将其服务器划分为多达 80,000 台虚拟服务器。

简单地向 CERN 的数据中心添加更多服务器机器不是一种选择。“我们在可用电力和冷却方面受到限制,”CERN 结构基础设施和运营组组长 托尼·卡斯 说。“我们希望从我们拥有的资源中榨取最后一滴,用于物理研究。 即使增加 10% 的容量也意味着为改进物理研究做出更多贡献。”

除了粒子加速器本身,LHC 还拥有几个粒子探测器——包括 ATLASCMS——在现场捕获碰撞期间产生的数据。“为了产生物理结果,CERN 的科学家首先必须将探测器产生的 1 和 0 转化为有意义的图像,显示碰撞中产生的不同量子粒子的轨迹,”卡斯说。“然后他们需要分析这些图像以了解它们的含义。”

探测器数据捕获和分析需要巨大的计算能力,但并非总是等量需要。 有时需要更多的计算来创建图像,有时则需要进行分析。 为了分配和重新分配处理器资源,卡斯和他的团队必须确定执行特定任务(例如分析)需要多少服务器。 如果他们发现其他地方需要更多计算资源,他们必须停止服务器上正在进行的批处理工作,重新配置它们,然后重新启动它们。 然而,虚拟服务器可以使用 Platform Computing 的软件动态地分配和重新分配,而无需中断已在进行的处理工作。

LHC 于 2008 年 9 月首次上线,旨在将质子束加速到机器产生的最高能量,每秒迎头对撞 3000 万次,每次碰撞产生数千个接近光速的粒子。 如果成功,LHC 可以帮助物理学家回答有关宇宙中物质和能量的亚原子组成的问题。

不幸的是,LHC 的第一次运行持续了仅仅一周多一点,就因为两个超导磁体出现问题而不得不停止。 该设备于 11 月再次短暂上线以进行一些实验,但自 12 月以来一直处于停机状态,因为 CERN 正在升级设备。 来自 85 个国家/地区的 10,000 多名研究人员计划使用世界上最强大的粒子加速器来测试有关高能物理学的不同预测。

当 LHC 在几周后重新上线时,预计将持续运行到 2011 年年中至年底,这是 CERN 历史上最长的加速器运行阶段,其历史可以追溯到 1954 年。“专用于 LHC 的计算机每天运行约 120,000 个计算作业,将需要以最大效率运行,以确保来自探测器的大量数据能够快速转化为物理结果,”卡斯说。 “作业”在此上下文中是指处理一定量数据的请求——例如,将探测器在给定时间段内产生的信息转化为图像,或者扫描大量这些图像进行分析。

卡斯说:“一旦真实数据到来,物理学家们竞相为期刊和会议发表论文,尤其是当出现任何发现的迹象时,计算团队的压力将会增加。” “对于 LHC 探测器来说,这是一个关键时刻。”

© . All rights reserved.