机器学习如何防止危险 DNA 落入恐怖分子之手

复杂的算法可以帮助 DNA 合成公司避免按需制造危险生物体

世界各地的生物学家经常付费给公司合成 DNA 片段,用于实验室或临床。但情报专家和科学家多年来一直担心,生物恐怖分子可能会劫持此类服务,制造危险的病毒和毒素,也许可以通过对基因序列进行微小的改变来规避安全检查,同时又不改变 DNA 的功能。

现在,美国政府正在支持使用机器学习来检测 DNA 序列是否编码了危险病原体的一部分。研究人员开始在设计基于人工智能的筛选工具方面取得进展,几个小组于 1 月 31 日在弗吉尼亚州阿灵顿举行的美国微生物学会 (ASM) 生物威胁会议上展示了早期成果。他们的发现可以帮助人们更好地了解病原体如何损害身体,以及科学家如何将 DNA 序列与特定的生物功能联系起来的新方法。

俄亥俄州哥伦布市技术开发公司巴特尔公司的计算生物技术主管奥马尔·塔巴 (Omar Tabbaa) 表示:“过去,你会把病原体锁起来,并在它面前部署一支军队,你就没事了。”


关于支持科学新闻

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。


但塔巴表示,DNA 工程成本的降低和难度的降低改变了生物安全威胁的性质。任何想要特定 DNA 片段的人都可以以每个碱基几美分的价格合成称为碱基的字母串。2006 年,英国《卫报》的记者付费给一家 DNA 合成公司制造了部分天花病毒,促使政府和科学家呼吁采取更严格的筛选措施

逐个字母

2009 年,几家最大的 DNA 合成公司组成了一个联盟,制定了标准化的程序,用于检查客户提交的序列是否与已知病原体的数据库匹配。如果自动筛选标记出一个序列,该公司可以在合成 DNA 之前检查客户是否是合法的研究人员。

但这些现有程序仅能挑出与已知病原体完全匹配的序列部分。聪明的恐怖分子可以通过改变病毒或产生毒素的基因中的几个碱基,甚至通过设计一种自然界中不存在的全新病原体来欺骗该系统。更糟糕的是,数据库本身通常充满了错误,这是由于 DNA 测序方式的差异造成的。

考虑到这一点,美国情报高级研究计划局 (IARPA) 于 2016 年发起了一项计划,旨在设计更好的算法来识别潜在的威胁序列。该计划的经理约翰·朱利亚斯 (John Julias) 表示,来自工业界和学术界的五个团队正在参与该计划的竞争。该机构拒绝透露该计划的预算。

到 2020 年,预计这些团队将开发出一种方法,在不到两周的时间内确定未知序列是否构成威胁。弗吉尼亚州夏洛茨维尔大学的软件工程师安德鲁·沃伦 (Andrew Warren) 表示,这将是一项艰巨的任务。“我们必须能够识别地球上的任何生物体及其分子功能。”

共同点

沃伦的团队正在设计一个程序,该程序将比较来自 90,000 种微生物物种的 4000 万个序列记录。该算法学会识别已知毒素和病原体的 DNA 序列,识别它们的共同特征,然后在其他生物体中搜索相似的序列。他的团队在 ASM 会议上展示的工作尚处于早期阶段,但沃伦表示,该算法已经可以可靠地预测序列来自哪种类型的生物体。

塔巴在巴特尔的团队正在使用来自公共和专有数据库的序列开发类似的算法,他表示,计算机算法可以识别人们会忽略的病原体之间的共性。这将有助于程序区分 DNA 序列的重要部分和那些可以在不影响病原体功能的情况下更改的部分。目标是找出未知序列中可能构成安全威胁的部分。

巴特尔团队希望该程序还可以揭示关于生物体基本生物学的新信息,例如一种允许毒素或病毒粘附在细胞上的通用 DNA 序列。塔巴表示,此类发现可以帮助研究人员开发快速诊断感染或改进生物制造的新方法。“我们认为这将会带来很多成果,”他说。

但华盛顿州西雅图的风险投资公司生物经济资本的总经理罗布·卡尔森 (Rob Carlson) 怀疑,阻止 DNA 合成公司被利用是否可以阻止生物恐怖袭击。“如果你看看迄今为止出现的生物威胁类型,这不是其中之一,”他说。大多数袭击都涉及在实验室中培养的现有病原体的释放;例如,2001 年,在美国,五人死亡,17 人因收到炭疽病信件而生病

卡尔森表示,恐怖分子更有可能遵循已发表的研究蓝图,而不是开展研究项目来设计新的生物体。他担心,任何政府监管 DNA 合成的努力都会将潜在的生物恐怖分子推向地下。

IARPA 拒绝就该机构是否也有此类担忧发表评论。

本文经许可转载,并于 2019 年 1 月 31 日首次发表

Sara Reardon is a freelance biomedical journalist based in Bozeman, Mont. She is a former staff reporter at Nature, New Scientist and Science and has a master's degree in molecular biology.

More by Sara Reardon

First published in 1869, Nature is the world's leading multidisciplinary science journal. Nature publishes the finest peer-reviewed research that drives ground-breaking discovery, and is read by thought-leaders and decision-makers around the world.

More by Nature magazine
© . All rights reserved.