作为一项新的国际研究联盟旨在追踪疾病潜在遗传起源的努力的一部分,测序的人类基因组数量将很快膨胀至1000个以上。但首先,来自犹他州的一个欧洲血统家庭的母亲、父亲和成年子女,以及来自尼日利亚的一个约鲁巴血统家庭的母亲、父亲和成年子女,将与一位匿名人士以及著名的遗传学家克雷格·文特尔和詹姆斯·沃森一起,成为少数拥有其约30亿个DNA碱基对完整读数的人类的记录。这六个人还将各自对其基因代码进行至少20次的检查,从而提供比现有基因序列高10倍的准确性,并为雄心勃勃的千人基因组计划铺平道路,该计划将全面绘制人类的遗传变异图。
“我们在2003年[从匿名人士]获得的参考序列只是一个人类基因组序列,但是有60亿人类,而我们所有人的序列都很重要,”该项目联合主席、英国剑桥的惠康信托桑格研究所的理查德·杜宾说。“我们无法获得所有人的序列,但是千人基因组计划的输出将更接近所有人的序列。”
根据该联盟的说法,该项目将分三个步骤进行。第一个步骤目前正在进行中,预计将在年底完成,是对这六个人的详细扫描。紧随其后的是对来自世界各地的180名匿名人士的 менее 详细的基因组扫描,然后再对另外1000人进行部分扫描。“如果我们查看大约1000个人,我们将获得在人类群体中频率约为1%或更低的这些样本中的遗传变异,”位于马里兰州贝塞斯达的国家人类基因组研究所遗传变异项目主任遗传学家丽莎·布鲁克斯说。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的具有影响力的故事的未来。
研究人员计划使用来自最初六个人的常见基因序列,以便在项目加速时允许 менее 严格的扫描。例如,来自详细个体扫描中的共享DNA片段可以填补后来扫描较少个体的空白。“这一切都需要测试,”布鲁克斯说。“进行这些扫描2次[两次]是否足够?”
最终项目的血液样本已经从前六名候选人以及来自世界各地随机选择的人群中采集:来自东京的日本人、来自北京的中国人、来自肯尼亚的卢希亚人和马赛人、来自意大利的托斯卡尼人、来自休斯顿的古吉拉特印度人、来自丹佛的中国人、来自洛杉矶的墨西哥裔美国人和来自美国西南部的非裔美国人。“我们想看看来自旧大陆的两个或三个主要大陆的几个人群。这为您提供了人群的多样性,但不需要特定的人群,”布鲁克斯指出。“我们不知道这些人确切是谁。”
研究人员没有收集任何可识别的个人信息,例如病史或基本的身高和体重数据,因为这项研究不是在寻找特定的疾病,而是在寻找人类遗传变异的范围。“一个社区100个样本中会有多少患有自闭症的个体?”布鲁克斯说。“这不是一个很好的疾病研究,但这将支持无数个经过适当设计的疾病研究。”
例如,一旦完成,千人基因组资源将使研究人员能够精确地找出与从自闭症到癌症等疾病相关的基因、染色体结构变异和其他个体基因组变异。使用目前可用的不完整的遗传信息,研究人员已经通过比较健康受试者和患病受试者之间的DNA变异,确定了至少100个与各种疾病相关的基因组区域。“这个项目正在讨论比现有遗传资源多一百倍的数据,”杜宾说。
它还将阐明人类的共同进化史。“我们将更多地了解……现代人类在从非洲传播之前进化的几百年前的时期,”杜宾说。“这可以通过观察基因组中出现的变异模式中的选择证据来研究。”
显然,所有人类中99%的DNA是相同的。但是,通过绘制其他1%的变异图,千人基因组计划可能有助于揭示某些疾病的遗传基础。“一旦你确定了这些因素,你就可以找出如何进行治疗,”布鲁克斯说。“它不会告诉你因果关系,但它会给你一份嫌疑人名单。”