本文发表在《大众科学》的前博客网络中,反映了作者的观点,不一定代表《大众科学》的观点
今年春天,美国国立卫生研究院将开始招募一百万美国人进行基因组测序,并提供他们的医疗记录和定期血样,并接受饮食、身体活动、心率和血压的监测。这项耗资14.55亿美元、为期10年的“我们所有人”研究计划将创建同类中规模最大、多样性最强的数据集,并可能为疾病提供新的见解。但这种大数据项目往往会过度承诺,同时将美国国立卫生研究院预算的如此大部分用于大型机构控制和参与者,这使得拥有原创假设的小型实验室更难获得拨款,并在科学领域竞争。
建立这种患者数据“生物样本库”与科学界向大型机构项目发展的趋势是一致的,这些项目的目标由等级制度和级别决定;这些项目让人想起公共和私营部门之间的人类基因组测序竞赛,以及ENCODE等项目,这些项目在几十年中使备受瞩目的实验室受益。退伍军人事务部是另一个公共研究部门,启动了“百万退伍军人”计划,迄今为止已招募了65万名退伍军人,并计划在未来两年内通过博思艾伦汉密尔顿等承包商对10万名参与者的DNA进行测序。凯撒医疗和盖辛格医疗等健康保险公司正在结合患者医疗记录构建基因数据集。诸如再生元制药、安进子公司deCode Genetics和Patients Like Me等公司也在创建大型基因数据库。
事实上,公共或私营团体都不能确定数据在几十年后会流向何处。生物样本库有时可能会将数据转售给第三方,从而产生类似于Facebook等社交网络公司现在面临的紧张关系。重要的是,如果更多疾病的遗传原因或风险因素得到进一步阐明,没有人能确定保险公司是否会将基因变异视为一种既往损伤的形式,这可能会影响保险覆盖范围的结构或成本。
关于支持科学新闻
如果您喜欢这篇文章,请考虑支持我们屡获殊荣的新闻报道,方式是 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的具有影响力的故事的未来。
如果人们为银行的“公共利益”贡献数据,那么它可能会对未来几代人产生反作用,他们将面临保险公司的偏见或歧视。与此同时,这种昂贵的生物样本库甚至不大可能导致大多数疾病治疗的根本性改变。
基因通常以复杂的方式与其他基因相互作用,产生正面或负面影响,这取决于它们的遗传背景。例如,一种基因变异可能会对复杂疾病产生少量风险,但在至少某些具有抵消或“负多效性”效应的基因变异的情况下,它可能不会有害。因此,即使科学家对一百万人的基因组进行了测序,从而提高了检测某些基因变异预测疾病影响的统计能力,仍然无法解决单个基因变异的影响如何在其他基因变异的背景下增强或减弱的棘手组合问题。
事实上,损害功能的基因变异在循环中非常常见。最近的一项研究表明,医院系统中3.7%的患者携带与单基因或孟德尔疾病相关的基因变异,并且根据亚临床症状未被诊断出来。另一项研究表明,我们几乎每个人都至少有一种,最多可能有六种隐性遗传疾病的基因变异,这意味着只有当一个人遗传了两个缺陷基因的副本时,该疾病才会出现。如果它们有助于平衡选择,即它们在某些细胞类型(如免疫细胞)中增加遗传多样性,但会增加患精神分裂症或癌症的风险,那么有害突变可能会保留在人群中。
用斯蒂芬·杰伊·古尔德的话来说,我们产生的遗传数据越多,我们就越发现我们每个人都是“一堆运转良好(通常令人钦佩)的古怪不完美;一套由不同背景下过去历史提供的奇特零件构建的临时性适应”。生物学是基于遗传权衡的,并且不符合那些认为我们正在朝着人类的完美或没有遗传风险的世界迈进的数据传播者的进步新自由主义观点。
而且,如果时间比逻辑或统计学更原始,那么生物分解是不可避免的,而且是不可逆转的。最近的一项研究将信息理论应用于控制基因表达的表观遗传密码,以显示这种表观遗传信息的保守性丧失——何时开启的记忆丧失,基因表达中的一种熵——如何导致衰老和癌症的过程。
与2018年7000亿美元的国防预算相比,这种生物样本库项目的成本很小。当然,我和其他科学家更希望削减国防预算以援助美国国立卫生研究院的预算。然而,将美国国立卫生研究院预算的如此大部分投入到大型系统项目中,会加剧生命科学领域中自上而下的机构控制问题,并使拥有关于生物机制的原创假设的小型实验室更难获得拨款。而且,实际上,解释基因相互作用的技术限制、遗传权衡的悖论以及生物学中熵的问题意味着大型系统数据项目不太可能导致医疗保健革命。