合成生物学书籍以 DNA 形式出版

该数据存储项目代表了以这种方式存储的最大的非生物数据

加入我们的科学爱好者社区!

来自 Nature 杂志

三位研究人员已将一本书的草稿编码到 DNA 中。这部 5.27 兆位的巨著包含 53,246 个单词、11 个 JPG 图像文件和一个 JavaScript 程序,使其成为以这种方式存储的最大的非生物数据。

DNA 具有存储海量信息的潜力。理论上,每个核苷酸(DNA 链的单个碱基单元)可以包含两位数据,因此每克双链分子可以存储 455 艾字节的数据(1 艾字节是 1018 字节)。这种高密度存储超过了无机数据存储设备,例如闪存、硬盘,甚至基于量子计算方法的存储。


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


这本书恰如其分地是一篇关于合成生物学的论文,由波士顿马萨诸塞州 Wyss 生物启发工程研究所的遗传学家 George Church 和 Sriram Kosuri,以及马里兰州巴尔的摩约翰·霍普金斯大学的生物医学工程师袁杲编码而成。他们在本周的《科学1 杂志上报告了他们的工作。

这标志着与之前的项目相比取得了重大进展——之前的最大项目编码的数据量还不到其六百分之一——但有机闪存驱动器仍需多年才能问世。该方法不适用于日常使用有很多原因。例如,目前存储和检索信息都需要数天的实验室工作,要么从头合成 DNA,要么对其进行测序以读取数据。

在加利福尼亚州圣何塞的 IBM-斯坦福自旋电子科学与应用中心开发高密度无机存储介质的 Stuart Parkin 表示,这项工作说明了非常规方法的潜力。“你可以说物理科学已经耗尽了概念的游乐场,我们现在需要超越那个世界,”他说。“生物世界与物理世界的这种结合将在未来十年内带来一些非常有趣的存储设备。”

简明扼要
不列颠哥伦比亚大学温哥华分校研究 DNA 分子如何在计算中应用的计算机科学家 Anne Condon 解释说,DNA 书籍的编码并没有涉及根本性的新技术,而更多的是对现有技术的创造性应用。

先前将信息存储在 DNA 中的尝试因难以制造完美的长链而受阻。较短的分子带来的挑战较小,因此 Church 及其同事将他们的存储链保持在仅 159 个核苷酸的长度,并生成每个链的多个副本,以使捕获和纠正突变更容易。

在每个单链中,96 个核苷酸表示编码为数字 1 和 0 的数据;19 个核苷酸显示这些数据块应如何排序;44 个核苷酸使测序更容易。研究人员的二进制代码将“零”分配给两种类型的核苷酸(A 和 C),将“一”分配给另外两种类型(G 和 T)。

Condon 说:“它以非常优雅的方式使用一些简单的想法来提高可以存储的信息密度。” 她说,这项技术最适合数据需要长期存储而无需读取的专门应用。

Kosuri 说,理想的存储期限可能长达数个世纪。即使其他存储技术变得像磁带和软盘一样过时,研究人员也将始终致力于改进 DNA 读取和写入技术,因为这种分子对生物学至关重要。

这将随着时间的推移降低成本,使 DNA 数据存储能够超越演示项目的范畴。Kosuri 说,测序技术的成本已经降至四年前的千分之一左右,而 DNA 合成在过去八年中也实现了同样的下降。“我们用于本文的 DNA 芯片包含 55,000 个寡核苷酸,”他补充道。“最新的芯片包含一百万个。”

本文经 Nature 杂志许可转载。这篇文章于 2012 年 8 月 16 日首次发表

© . All rights reserved.