深度学习提升细胞和基因的可视化效果

神经网络使生物图像更易于处理

眼睛被誉为心灵的窗户,但谷歌的研究人员认为眼睛是个人健康的指标。这家科技巨头正在使用深度学习来分析视网膜照片,从而预测一个人的血压、年龄和吸烟状况。谷歌的计算机从血管的排列中收集线索,一项初步研究表明,这些机器可以利用这些信息来预测某人是否面临即将发生心脏病的风险。 

这项研究依赖于卷积神经网络,这是一种深度学习算法,正在改变生物学家分析图像的方式。科学家们正在使用这种方法来寻找基因组中的突变,并预测单个细胞布局的变化。谷歌的方法在8月份的一篇预印本中有所描述(R. Poplin et al. 预印本,网址: https://arxiv.org/abs/1708.09843; 2017),是新一波深度学习应用浪潮的一部分,这些应用使图像处理变得更容易、更通用,甚至可能识别出被忽视的生物学现象。 

“在以前,将机器学习应用于生物学的许多领域是不现实的,”谷歌研究部门位于加利福尼亚州山景城的工程主管菲利普·纳尔逊说。“现在你可以了——但更令人兴奋的是,机器现在可以看到人类可能没有看到的东西。”


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


卷积神经网络使计算机能够高效且全面地处理图像,而无需将其分割成部分。这种方法在2012年左右在科技领域兴起,这得益于计算机 power 和存储技术的进步;例如,Facebook 使用这种类型的深度学习来识别照片中的面孔。但科学家们很难将这些网络应用于生物学,部分原因是不同领域之间的文化差异。“找一群聪明的生物学家,把他们放在一间满是聪明的计算机科学家的房间里,他们会用两种不同的语言交谈,并且有不同的思维模式,”卡利科的首席计算官达芙妮·科勒说,卡利科是一家生物技术公司,总部位于加利福尼亚州旧金山,由谷歌的母公司 Alphabet 支持。 

科学家们还必须确定可以使用哪些类型的研究,这些研究需要使用大量的图像集进行训练,然后才能开始进行预测。当谷歌想使用深度学习来寻找基因组中的突变时,其科学家们不得不将 DNA 字母链转换成计算机可以识别的图像。然后,他们用与参考基因组对齐的 DNA 片段以及已知突变的 DNA 片段来训练他们的网络。最终的结果是 DeepVariant,这是一个于 12 月发布的工具,可以找到 DNA 序列中的微小变异。在测试中,DeepVariant 的性能至少与传统工具一样好。

位于华盛顿州西雅图市艾伦细胞科学研究所的细胞生物学家正在使用卷积神经网络将用光学显微镜捕获的细胞平面灰度图像转换为 3D 图像,在这些图像中,细胞的某些细胞器被标记为彩色。这种方法消除了对细胞进行染色处理的需要——染色处理需要更多的时间和复杂的实验室,并且会损坏细胞。上个月,该小组公布了一项先进技术的细节,该技术可以使用少量数据(例如细胞轮廓)来预测更多细胞部分的形状和位置G. R. Johnson et al. 预印本,bioRxiv http://doi.org/chwv; 2017。 

“你现在看到的是机器学习在完成与成像相关的生物学任务方面取得了前所未有的转变,”麻省理工学院和哈佛大学博德研究所成像平台主管安妮·卡彭特说。2015 年,她的跨学科团队开始使用卷积神经网络处理细胞图像;现在,卡彭特说,这些网络处理了她中心约 15% 的图像数据。她预测,这种方法将在几年内成为该中心的主要处理模式。 

其他人最兴奋的是,使用卷积神经网络分析图像可能会无意中揭示微妙的生物学现象,从而促使生物学家提出他们以前可能没有考虑过的问题。“科学中最有趣的短语不是‘尤里卡!’,而是‘这很奇怪——发生了什么?’”纳尔逊说。

艾伦研究所执行主任里克·霍维茨说,这种意外的发现可能有助于推进疾病研究。他说,如果深度学习能够揭示单个细胞中癌症的细微标记,那么它可能有助于改进研究人员对肿瘤进展的分类。这反过来可能会引发关于癌症如何扩散的新假设。

生物学领域的其他机器学习鉴赏家已将目光投向新的前沿领域,现在卷积神经网络正在图像处理领域起飞。“成像很重要,但化学和分子数据也很重要,”德国环境健康研究中心位于诺伊赫贝格的计算生物学家亚历克斯·沃尔夫说。沃尔夫希望调整神经网络,使其能够分析基因表达。“我认为未来几年将会有非常大的突破,”他说,“这将使生物学家能够更广泛地应用神经网络。”

本文经许可转载,并于 2017 年 1 月 3 日首次发表

© . All rights reserved.