作者:Declan Butler
“凭借这种深刻的新知识,人类即将获得巨大的、新的治愈能力。它将彻底改变大多数(如果不是全部)人类疾病的诊断、预防和治疗。” 比尔·克林顿总统于 2000 年 6 月 26 日在白宫东厅的活动中宣布,以庆祝由公共资助的国际人类基因组计划及其私营部门竞争对手,马里兰州罗克维尔的塞莱拉基因组公司完成人类基因组序列的第一个草图组装。
十年过去了,人们希望的对抗人类疾病的革命尚未到来——《自然》杂志对 1000 多名生命科学家的调查显示,大多数人预计这种情况在未来几十年内也不会发生。然而,该序列带来的却是生物学领域的革命。它改变了科学家的职业生涯,激励他们去解决新的生物学问题,并在此过程中提出了一些尖锐的新挑战。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。
几乎所有接受调查的生物学家都受到了人类基因组序列可用性的影响。高达 69% 的《自然》杂志调查受访者表示,人类基因组项目要么激励他们成为科学家,要么改变了他们的研究方向。大约 90% 的人表示他们自己的研究受益于人类基因组的测序——其中 46% 的人表示“显著”受益。近三分之一的人在研究中“几乎每天”都使用该序列。“对于像我这样的年轻研究人员来说,很难想象生物学家在没有它的情况下是如何工作的,”一位科学家写道。
这项调查主要通过《自然》杂志的印刷版和网站吸引参与者,旨在粗略衡量意见,它还揭示了研究人员如何面对关于他们自己基因组的日益增长的信息可用性。大约 15% 的受访者表示他们在医疗环境中进行了基因检测,近十分之一的人使用过直接面向消费者的基因检测服务。当被问及如果他们可以对任何东西进行测序,他们会选择对什么进行测序时,许多受访者列出了他们自己的基因组、他们孩子的基因组或其他家庭成员的基因组(该列表还包括一些宠物狗和猫)。
有些人显然对这个机会感到不耐烦:大约 13% 的人表示他们已经对自己的 DNA 的一部分进行了测序和分析。五分之一的人表示,如果花费 1000 美元,他们就会对其整个基因组进行测序,而大约 60% 的人如果花费 100 美元或如果该服务是免费的,他们也会这样做。其他人对自己的基因组测序则要谨慎得多——大约 17% 的人勾选了“即使有人付钱我也不做”的选项。
《自然》杂志的调查还衡量了该序列对科学本身产生最大影响的领域。尽管近 60% 的受访者表示他们认为基础生物科学已从人类基因组序列中显着受益,但只有约 20% 的人认为临床医学也同样如此。我们的受访者承认,解释该序列被证明是比破译它更大的挑战。大约三分之一的受访者将该领域对基因组生物学的基本理解不足列为当今利用序列数据的主要障碍之一。
序列只是开始
过去十年的研究表明,基因组的复杂性,以及事实上人类生物学的几乎每个方面,都比以前想象的要大得多。例如,识别构成基因组约 1.5% 的约 20,000 个蛋白质编码基因是相对简单的。但研究人员指出,了解这一点并不一定能解释这些基因的作用,因为许多基因编码多种形式的蛋白质,每种蛋白质都可能在多种生物过程中发挥不同的作用。“我认为,需要整个序列才能让我们看到我们的一基因一蛋白质的遗传模型过于简单化,”一位受访者写道。
后基因组生物学的十年也让人们重新关注蛋白质编码基因之外的区域,其中许多区域可能通过调节蛋白质编码基因的表达和产生大量非编码 RNA 分子而具有关键功能。“现在我们明白了,”另一位调查受访者写道,“如果不研究基因组的动态,确定其序列的用途是有限的。” 一些大型项目正在进行中,以填补空白,包括 DNA 元件百科全书 (ENCODE) 和人类表观基因组计划,该计划旨在了解基因组的化学修饰,现在认为这是控制基因表达的主要手段。
根据调查,基因组序列的最大影响是贸易工具的进步:测序技术和计算生物学。技术创新使测序成本大幅下降,并且每日序列输出量飙升。“深度测序技术现在正在成为科学研究的主要内容。如果不是完成人类基因组所需的技术推动,这种情况会发生吗?” 一位受访者写道。
数据梦想,分析噩梦
然而,更便宜、更快的测序带来了自身的问题,我们的调查揭示了许多研究人员感到多么没有能力处理呈指数增长的序列数据。首要关注的问题——几乎一半的受访者都提到了——是缺乏足够的软件或算法来分析基因组数据,紧随其后的是合格的生物信息学家的短缺,以及在较小程度上是原始计算能力。其他担忧包括数据存储、测序数据的质量以及基因组组装的准确性。美国马里兰州贝塞斯达国家生物技术信息中心主任戴维·利普曼在评论调查结果时表示,对数据处理和分析的担忧甚至在基因组项目的最早讨论中就出现了。他认为,也许“有一种失望,尽管拥有如此多的数据,我们仍然有很多不了解的地方。”
贝塞斯达国家人类基因组研究所 (NHGRI) 所长埃里克·格林表示,该研究所非常清楚需要更多的生物信息学专家、更好的软件以及更清楚地了解基因组之间的差异如何影响人类健康。他说,该研究所计划在 2010 年底发布其下一个基因组学领域的五年战略计划。3 月下旬 NHGRI 研讨会上讨论的一种可能的解决计算挑战的方法是云计算,实验室从 Google、Amazon 和 Microsoft 等公司购买远程计算农场的计算能力和存储空间。5 月 10 日在英国剑桥欧洲分子生物实验室的欧洲生物信息学研究所启动的欧洲核苷酸档案也将为实验室提供其基因组数据的免费远程存储和生物信息学工具的使用。
鉴于 10 年的后见之明和目前的一系列障碍,研究人员现在对人类基因组学能够交付的内容和时间抱有较为适度的期望,这并不奇怪。对人类基因组进行测序和探索的理由——彻底改变新药物、诊断和疫苗的发现,并根据个人的基因构成量身定制治疗方法——今天仍然相同。但现在几乎一半的受访者表示,在 2000 年之前,人类基因组的好处被过分夸大了。“虽然我确实觉得人类基因组项目取得的成果非凡,并且对我的研究产生了重大影响,但我仍然觉得它对普通民众的宣传过度了,”一位典型的受访者写道。超过三分之一的受访者现在预测,基于遗传信息的个性化医疗将在 10-20 年内变得普遍,而超过 25% 的受访者甚至认为需要更长的时间。大约 5% 的人预计这辈子不会发生。“我们对基因组的理解不会在一瞬间出现。它将是一个由数十亿个较小见解组成的有组织的层次结构,”加州大学圣克鲁斯分校基因组生物信息学小组负责人 David Haussler 说。
格林说,当人类基因组计划设想时,当时的科学领导人预测,生成第一个序列需要 15 年,而生物学家理解它需要一个世纪。“我认为他们说得差不多,”他说。“虽然我们仍然没有所有答案——在手头拥有人类基因组序列的情况下,我们仅仅走过了这个世纪的 10%——但我们已经了解了有关人类基因组如何运作以及如何改变它带来疾病风险的非凡事情。”
Haussler 表示同意。“在最初的十年中发生的一切仍然只是当我们将开始真正理解基因组时,即将发生更巨大变化的早期预兆,”他说