“外显子组”测序:研究人员借鉴基因组学来解读环境暴露与疾病的联系

技术和分析的进步正在帮助环境暴露走上基因谱分析的道路,从而更精确地预测个人的疾病风险


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。 通过购买订阅,您将帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。


双酚A感到焦虑吗?害怕杀虫剂吗?大量的科学文献表明,对某些化学物质可能增加慢性疾病风险的担忧是合理的。尽管遗传因素可能会使人易患多种疾病,但根据最近的流行病学研究,超过一半的疾病风险——甚至可能高达 90%——可能源于环境因素。

然而,环境领域一直缺乏高质量的硬数据,而这种高质量的数据现在可以从基因研究中收集。许多科学家认为,如果要解开慢性疾病背后复杂的风险网络,研究人员就需要开发“外显子组”,这是一个高度详细的环境暴露图谱,可能贯穿人的一生,可以映射到主要疾病(包括癌症、糖尿病和心脏病)的病因学(病因研究)。

长期以来,流行病学研究中,环境因素一直被降级为问卷调查,通常要求受试者在一个问题中估算一生的暴露量。即使对于那些关注环境相关性的研究,研究人员也“只是询问人们他们的暴露情况”,加州大学伯克利分校环境健康教授史蒂夫·拉帕波特说。“你怎么能想象你能通过这种方式获得任何分辨率呢?”

尽管总体趋势可以帮助研究人员在暴露和疾病之间建立联系,但有了这些松散的关联,“你真的无法在生物学层面弄清楚发生了什么”,他指出。

此外,化学物质不仅仅是进入人体并以孤立状态存在。一旦进入体内,它们可以与体内广泛的细胞相互作用,并且自身经常发生变化。

拉帕波特等研究人员感兴趣的化学暴露不仅来自我们皮肤以外的世界,也来自我们体内发生的自然过程。从产生氧化应激或炎症的生物过程来看,我们的身体面临着不断变化的内部环境。“我们真的需要将环境视为体内正在发生的事情,并接受来自各个来源的事物,”拉帕波特说。他在10月21日在线发表在科学杂志上的一篇论文中提出了支持推进外显子组研究的证据。

“我们从未以一种能够让我们发现这些事物的方式来审视我们体内整个环境,”拉帕波特说。

但是,如何分析看似无限的集合的外部和内部因素呢?

斯坦福大学医学院助理教授阿图尔·布特也曾在环境与疾病联系领域工作过,他承认这是一项艰巨的任务。“你正在研究一组无限的变量,”他说。“但这并不意味着我们不应该尝试开始测量它们。”

体内的毒素
许多环境风险研究将目光投向了人们日常居住的世界。儿童和准妈妈们随身携带空气质量监测仪;研究人员对饮用水中的大量化合物进行了采样。但拉帕波特和他的合著者,同样是伯克利公共卫生学院教授的马丁·史密斯,在他们的新论文中认为,应该从体内评估暴露情况,例如通过血液样本。

“人们确实认为化学暴露来自体外,”拉帕波特说。但是,他认为,“如果人们总是想着空气污染和水污染,我们就不会取得多大进展。”事实上,他补充说,“有太多的自然过程会产生有毒化学物质——而且正在体内发生。”

与引人注目的污染物(如双酚 A、邻苯二甲酸盐或苯)相比,来自体内的毒性暴露更为常见。“这些物质的血液浓度与您从外源性化学物质中获得的浓度相比真的很高,”拉帕波特指出。

例如,关于人类微生物组的新发现表明,甚至比我们可能想象的还要多——或者可能更喜欢想象。“我们体内充满了细菌,它们正在产生废物,”拉帕波特说。从暴露的角度来看,“根本没有理由认为我们可以忽略类似的事情。”

计算化学物质
然而,在研究人员开始绘制环境暴露星群中的模式之前,他们需要组装更全面的可能的内部和外部暴露图景。

“这很复杂,”拉帕波特承认,他开始这项庞大的事业。“但是,如果你从我们大约 20 年前解决的人类基因组计划的角度来看,我认为它并没有那么令人畏惧。”

环境数据的匮乏主要源于对看似更性感的遗传相关性领域的关注,拉帕波特说。“人们一直在花费他们所有的时间、精力和金钱来研究遗传因素,”他指出。因此,在理解环境方面——以及可以说是更强大的方面——起作用的因素方面,“他们几乎没有触及表面。”

然而,已经取得了一些进展。为了开发化学特征谱或代谢组,已经分析了数千种小分子代谢物。但是,少数已完成的研究仅采用了相对较小的可用化学读数样本进行评估。

一项研究于 5 月在 PLoS ONE 上发表,并由布特共同撰写,扫描了数千人的血液和尿液样本中不同化合物的存在,寻找与 2 型糖尿病的相关性。“我认为这真的是一个很好的例子,说明我们应该能够做到什么,”拉帕波特说。

然而,拉帕波特指出,这项研究并不像当代的全基因组关联研究 (GWAS) 那样有力。他解释说,真正的 GWAS 调查了数十万个基因,而糖尿病研究仅研究了 266 种环境化学物质。

这种简化的方法可能导致假阳性关联,并且更可靠的相关性被遗漏。拉帕波特指出,这些较小的化学样本研究更“类似于他们所说的候选基因研究”,其中研究人员仅评估少数可能的基因,“而不是 GWAS”。他补充说,从基因组学领域吸取教训,在 GWAS 随访之后,最初从候选研究中标记的基因“几乎总是被证明不重要”。

加入遗传学
人类基因组计划作为其他领域的模型,其大部分吸引力在于它对数据的忠诚。它的搜索和绘制任务允许对基因组进行很大程度上公正的调查。然而,这样一个清晰的计划到目前为止已被证明在一个经常被普遍的化学和疾病特异性假设所玷污——实际上是被驱动——的领域中是困难的。

拉帕波特和史密斯在他们的论文中认为,单源和单病研究的常用策略为时过早,应该搁置,转而对所有内部和外部暴露进行更广泛的调查。“我们现在正处于我们真的不知道什么重要的时候,”拉帕波特说。因此,调查每种可能的暴露——以及暴露的组合——至关重要,他指出。

然而,与人类基因组相当的环境数据集(如外显子组)仍然遥遥无期,其完成取决于主要研究资助者(如美国国立卫生研究院)的支持。美国国立卫生研究院正在进行一项名为基因、环境与健康倡议 (GEI) 的为期五年、耗资 2 亿美元的项目。然而,拉帕波特说,考虑到缺乏关于等式中环境暴露方面的数据,这种配对仍然具有挑战性。

“即使我们在这些疾病的遗传学方面不断取得进展,我们也要继续研究环境,”布特说。“也许基因的变异只有在个体恰好处于我们甚至不知道的环境中时才会导致疾病,”他说。弄清环境暴露的真相有可能阐明许多目前看来完全随机的疾病和基因突变。

遗传学和环境之间长期存在的划分本身可能需要一些模糊。“我们建立这些人为的结构可以追溯到一百年前,”布特说。“这让我们认为要么是遗传因素,要么是环境因素,但实际上,其中大多数可能是混合因素。”

因此,提高我们对慢性疾病风险的理解将需要更多像 NIH 的 GEI 这样的跨学科伙伴关系。“大多数遗传学家将环境视为他们遗传研究的混杂因素,”布特说。但他提出了改变后的格言:“一位研究人员的混杂因素是另一位研究人员的信号。”

这项工作还需要技术上的进步,类似于基因组学领域通过高通量基因测序加速发展的方式。快速、经济实惠和全面的化学分析可能在收集大量数据方面大有帮助,这些数据对于开始更好地解析环境在疾病风险中的作用是必需的。布特希望研究对象甚至愿意的住院病人将开始作为常规事项进行筛查,以帮助积累开始建立可靠的疾病-暴露联系所需的大量数据。

最终,这些数据可能会开始带来回报。“这些是您最终可以在医生办公室看到的东西,”拉帕波特说。“期望医生定期筛查患者的 100 种左右最相关的化学物质以评估疾病风险,这并不需要太大的想象力,就像今天的血液检查可以揭示高胆固醇或其他危险信号一样。他指出,这种实际应用将与“未来医学更具预测性和更个性化”的愿景非常吻合。

© . All rights reserved.