世界人类遗传学数据库将迁至亚马逊云

200太字节的“千人基因组计划”数据现在将免费存储,但分析计算资源将收费

加入我们的科学爱好者社区!

美国国立卫生研究院于周五(3月30日)宣布,它将在亚马逊云服务上免费托管其“千人基因组计划”的数据。“千人基因组计划”是世界上最大的的人类遗传学数据库。它的创建目的是作为一个“参考人群”,包括来自世界各地不同种族的人,并且它捕捉了人类在基因上发生变化的所有主要方式。现在它们托管在亚马逊的服务器上,科学家们可以更容易、更便宜地获取和分析“千人基因组计划”中的数据。

纽约西奈山医学院基因组学研究所所长埃里克·沙德特在给 InnovationNewsDaily 的电子邮件中写道:“[亚马逊托管] 以更有用的方式向研究人员提供数据,并避免研究人员花费大量资金在本地系统上存储数据。这绝对很酷。”

尽管名称如此,该项目实际上拥有来自 1,700 名匿名人士的遗传信息,今年还将增加 900 人。该数据库的主要困难在于它太大了——200 太字节,这个量可以填满 30,000 张 DVD。数据库中的信息一直可以在 1000genomes.org 上免费获得,但沙德特解释说,在亚马逊托管协议之前,科学家们必须为下载数据的互联网带宽和存储空间付费。无法访问存储“千人基因组”数据所需的强大计算机的人根本无法读取数据。 


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。


亚马逊网络服务还向希望对庞大的遗传学数据库进行计算的研究人员提供其超强的计算资源。为此,亚马逊将收费。《纽约时报》的 Bits 博客报道称,该公司向一家制药客户收取每小时 1,279 美元来运行非常大的计算。然而,研究人员可能仍然会发现这个价格是值得的。沙德特写道:“许多人愿意承担这笔费用,因为它远比购买 500 太字节的磁盘存储和一个中等规模的计算机集群来在本地分析这些数据便宜得多。” 

沙德特写道,通过使基因组数据对研究人员来说更易于访问和负担得起,亚马逊的交易最终可能有助于科学家根据一个人的基因更可靠地预测疾病。 

这项交易是奥巴马政府一项新计划的一部分,该计划将投资 2 亿美元,用于研究更好的方法来存储、分析和查找“千人基因组”等超大型数据集中的有趣点。 

版权所有 2012 InnovationNewsDaily,TechMediaNetwork 公司。保留所有权利。未经授权,不得发布、广播、改写或重新分发此材料。

© . All rights reserved.