“退伍军人基因组计划”作为定制化医疗的早期试验平台

退伍军人事务部这项为期四年的倡议包括数千个DNA序列,以及一些隐私方面的专业知识

iStock/Thinkstock

在奥巴马总统公布耗资2.15亿美元的“精准医疗计划”(旨在更好了解疾病中的基因变异并开发疗法)的四年前,退伍军人已经自愿参与一项前沿工作,以推动这种量身定制的医疗。这项名为“百万退伍军人计划”(MVP)的项目旨在从一百万通过退伍军人健康管理局(通常称为 VA)接受医疗服务的志愿者那里获取完整的健康信息和 DNA 分析。现在,当其他研究团队试图扩大其自身努力以响应总统的倡议时,VA 的努力是这个缺乏路标的领域中为数不多的指路明灯之一。

这个刚起步的 VA 项目现在拥有近 40 万份与电子医疗记录和专门设计的问卷相匹配的血液样本。每个血液样本都分析了超过 70 万个单核苷酸多态性 (SNP)——常见的基因变异,根据其位置或对基因功能的影响,可能与各种疾病相关。数千个血液样本也为了特定的研究项目进行了更全面的测序,这些项目需要科学家更深入地了解志愿者的基因构成。为了准备这些血液样本进行测序,研究人员必须首先从血液中分离出白细胞并从中提取 DNA。

这仅仅是第一步。完整医疗记录、基因信息和详细人口统计问卷的结合可能是开始解开关于精神分裂症、创伤后应激障碍和其他疾病(包括心血管疾病)问题的秘诀。至少这是 VA 的希望。“这是一种新型的科学,我们确实是在不断发明方法,”领导 MVP 的两位首席研究员之一 Michael Gaziano 说。其他类似的美国生物样本库——包括范德比尔特大学北加州凯撒医疗集团运营的生物样本库——尚未达到 VA 项目的规模。因此,目前,旨在参与精准医疗计划的研究人员正将 VA 的努力视为为数不多的可用模型之一。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您将帮助确保未来继续刊登关于发现和塑造我们今天世界的想法的有影响力的报道。


白宫科技政策办公室科学副主任 Jo Handelsman 在一份声明中告诉《大众科学》,这项庞大的 VA 项目——将基因数据与临床、生活方式和环境信息联系起来——将“通过其承诺提供的见解,为奥巴马总统更广泛的精准医疗计划提供信息”,并“帮助指导 PMI 计划中的百万人队列的设计和实施”。

但是,VA 所做的不仅仅是从大量新患者那里收集信息和血液样本。另一位 MVP 首席研究员 John Concato 说,VA 的一些专门研究项目包括一项正在进行的基因分析,该分析比较了 9,000 多名被诊断患有精神分裂症或双相情感障碍的参与者与未患有这些疾病的个体。本月,退伍军人事务部宣布了另外四个研究项目,这些项目将利用 MVP 数据。它们将侧重于心脏病、肾病和药物滥用的遗传因素。白宫表示,这些努力还将有助于为精准医疗计划应如何总体规划提供信息,包括“应包含的数据类型和数据平台的设计”。

这些都是巨大的障碍。基因组测序数据占用大量的计算机空间。表征构成人类基因组的所有 30 亿个碱基对(DNA 梯子上的 A、C、T 和 G 字母)比大型歌曲或电影文件占用更多的计算机内存。即使存储来自基因组中称为外显子组的较小子集的信息(其中包含约 20,000 个基因,这些基因提供制造蛋白质的指令)也是一项巨大的工作。北卡罗来纳大学教堂山分校文艺复兴计算研究所的遗传学家和生物学首席领域科学家 Kirk Wilhelmsen 说:“如果有人用 10 号字体的单倍行距打印出一个人的整个基因组,则需要 66 万页。” 他说,一个完整的全基因组序列可能占用相当于五张 CD 的空间——仅适用于一个人。即使对一个人的外显子组进行测序,也需要占用大约 1% 到 2% 的空间。然而,VA 拥有大约 28,000 个外显子组序列和 2,000 个全基因组序列。

但空间并不是此类项目的唯一障碍。基因组测序数据也可能特别吸引黑客。VA 采取了具体措施来保护数据。“我们设计这个系统的目的是最大限度地保护患者的机密性。我们实现这一目标的一种方式是,装有样本的管子只关联一个条形码,”VA 首席研究与开发官 Timothy O’Leary 说。“我们这样做是为了减少匿名性丢失的可能性。”

VA 基因组计划已经在全国范围内展开,患者在约 50 个地点自愿参与,尽管该项目的某些部分是集中化的。例如,一个支持数据共享的大型计算机处理中心位于匹兹堡。当然,还有血液。

在波士顿一个两层楼高的液氮冷却冷冻库中,浸泡着近 40 万管退伍军人的血液。样本保存在零下 80 摄氏度。当需要时,机械臂会将它们从冰冷的舱位中取出。它们没有受到美国许多医学研究项目中普遍存在的、过于关注人口统计抽样的某些限制:它们拥有大量服务不足的少数族裔人口,包括非裔美国人、西班牙裔和美洲原住民。(根据 Concato 的说法,大约 8% 的 MVP 样本来自女性,这与女性退伍军人的总体比例一致。)Gaziano 说,这些样本还包括“我们认为非常年长的男性”。大约 2,000 名参与者年龄在 90 岁或以上,超过 200 名参与者年龄在 95 岁或以上。

这不是第一次收集军人的医疗和生物样本,但它将提供与任何其他样本不同的信息。例如,马里兰州的国防部血清库已经存储了来自 1000 万人的超过 5000 万份血清样本——一种富含抗体和蛋白质的淡黄色液体。但血清并不适用于基因组分析,因为它们几乎不含可用的 DNA。相反,基因测序工作通常依赖于从白细胞中分离 DNA(MVP 的标准)。

该存储库最初开始收集样本是作为 HIV/AIDS 计划的一部分,但仍然深陷争议。许多军人(以及通过 VA 系统接受护理的家属)没有意识到他们的样本将被永久保存。有些人甚至要求退回样本——但没有成功。相比之下,VA 通过邮寄信件邀请个人参与 MVP,或者在他们在 VA 医生办公室接受护理时招募他们。同意参与的志愿者填写一份深入的问卷,其中询问可能未包含在其官方健康记录中的医疗和人口统计问题。他们还捐献了相当于约两汤匙的血液。

由于退伍军人通过长期依赖电子医疗记录的综合系统访问其医疗保健服务,这些记录跟随患者从一个地点到另一个地点,因此 MVP 研究人员在尝试收集有关志愿患者的信息时具有内在优势。其他研究项目可能没有那么幸运。

© . All rights reserved.