研究人员借助超级计算寻找疟疾的弱点

Intellectual Ventures 构建计算机模拟,以更好地了解疟疾的传播方式以及对根除工作的反应


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您将有助于确保关于塑造我们当今世界的发现和思想的具有影响力的故事的未来。


了解传染病的细微之处,尤其是疟疾,该疾病在2008年导致全球约100万人死亡,是消灭它们的关键一步。然而,要清楚了解疟疾如何传播以及它如何对根除工作做出反应,意味着需要访问来自各种来源的大量数据,这类工作最适合由一台数据处理能力强大的超级计算机完成。

超级计算机曾经是少数大学和政府实验室的特权,但近年来,它们已被重新定义,使其更容易为小型研究实验室所用。这包括来自华盛顿州贝尔维尤的 Intellectual Ventures 的一个团队,他们正在利用过去一年投入使用的超级计算机的速度和力量,创建复杂的模拟,他们希望这些模拟能够揭示复杂问题的解决方案,包括疟疾的传播。

Intellectual Ventures 的超级计算机是一项正在进行的工作,由该组织内的两个不同的研究团队共享——一个团队研究疟疾(pdf),另一个团队,名为TerraPower,研究核反应堆技术。疟疾项目于 2007 年启动,此前比尔和梅琳达·盖茨基金会呼吁 Intellectual Ventures 开发新的技术来对抗疟疾。这促使人们产生了使用计算机模型来模拟该疾病在全球传播的想法。

该超级计算机由 138 台戴尔刀片服务器组成,每台服务器运行多个处理单元(或核心),总共有 1,104 个核心。Intellectual Ventures 通常将其中 1,024 个核心用于 TerraPower,其余的用于其疟疾研究。研究人员选择 Microsoft Windows 作为其操作系统(Linux 也常用于超级计算集群),因为他们设施的系统管理员熟悉 Microsoft 软件。微软联合创始人比尔·盖茨正在投资 TerraPower 和疟疾项目,并且 Intellectual Ventures 本身是由前微软高管 内森·米尔沃德爱德华·荣 成立的,这对他们也有所帮助。

该超级计算机拥有 5 太字节 的内存和 30 太字节的存储空间,提供了强大的数字处理能力,但如果没有指导计算机的软件,这将毫无意义。该软件提取关于 疟原虫 寄生虫及其携带者蚊子的行为和繁殖率的生物学数据,以及关于人类感染模式和免疫反应的信息。其他数据包括人们居住的地点和旅行方式,对疟疾传播很重要的环境因素(温度、降雨和海拔高度),以及不同种类蚊子的位置。该软件使用来自各种来源的数据,包括世界卫生组织、疟疾地图集项目、大学和 NASA,来创建疟疾爆发如何发生的模型。

在去年超级计算机投入使用之前,疟疾项目研究人员使用一台八核计算机来建立其研究的基础。然而,他们需要扩展他们的计算能力,以便更准确地模拟更大地理区域的疾病。“更大的集群意味着您可以在相同的时间内模拟更大的区域,”Intellectual Ventures 的研究科学家 菲利普·埃克霍夫说。该团队使用 蒙特卡洛方法创建其疟疾模拟,依靠来自重复试验的信息来构建结果。因此,访问更多的核心允许研究人员更快地运行更多的试验并更快地达到他们的目标试验次数。

周三下午早些时候,超级计算机正在运行九个不同的研究任务。其中一项任务需要 72 个计算机核心来执行,是对印度潜在的脊髓灰质炎计划的模拟。该模拟包括有关印度人口(年龄、全国人口分散情况、迁徙模式和人口统计数据)的信息,并演示了当人们相互互动时,疾病可能如何传播的场景。“这是一种概率方法,”埃克霍夫说。“有些互动会导致疾病,有些则不会。”

Intellectual Ventures 计划通过添加节点进一步扩展其超级计算机。该公司计算机设施有增长空间,可以容纳多达 3,000 个核心,而无需更改设施的电力和冷却系统。研究人员估计,如果对电力和冷却进行投资,他们可以挤入多达 6,000 个核心。

在预算范围内对超级计算能力的需求吸引了通常在较小范围内运营的科技供应商进入高性能计算领域。微软(通过其 Windows Azure 平台)、亚马逊(通过其 亚马逊网络服务)和其他公司正在提供“云”服务,他们使用其庞大的数据中心来托管客户的数据、软件和计算资源,客户通过他们的台式电脑访问他们寻求的信息。

微软本周早些时候推出了一项计划,该计划将特别关注提供托管的高性能计算资源。“我们的理解是,微软技术计算小组正在努力将‘技术计算’,即超级计算,带给大众,”Intellectual Ventures 系统工程师约翰-卢克·佩克说,他指出他公司的超级计算机使用微软软件,可以利用并行处理。“他们的解决方案可以并且将会为以前无法获得的研究人员、学生和其他人带来机会。”

尽管云计算已经取得了很多进展,但对于包括 Intellectual Ventures 在内的每个研究小组而言,这都不是一个选择。构建他们自己的超级计算机的主要原因是他们的一些项目可能具有国家安全意义,这意味着这些数据不能出口到国外(许多服务提供商在国外设有数据中心),Intellectual Ventures 的咨询物理学家兼 TerraPower 的中子和建模负责人查克·惠特默说。

第二个原因是分布式、基于云的方法在信息传输方面比在本地系统有更多的时间延迟。佩克说,虽然 Intellectual Ventures 通常可以实现每秒 20 千兆位的数据传输速率,以将其计算机的数据传输到超级计算机,但如果他们使用位于场外的超级计算机,研究人员可能甚至无法获得十分之一的速度。

© . All rights reserved.