消费者基因组学时代已经到来。现在,您可以将一小瓶唾液邮寄出去并付费查看您独特的基因密码与人类各种活动(从运动到特定饮食,再到护肤霜,再到对高级葡萄酒的偏好,甚至到约会)有何关系。这个市场上最广泛和最受欢迎的公司分析血统,其中最大的是 23andMe 和 AncestryDNA,它们在数据库中都拥有超过五百万用户。这些数字使科学数据库中人类基因组的数量相形见绌。基因谱系学是一项大生意,并且已经成为主流。但是这些测试到底有多准确呢?
首先,了解一点遗传学基础知识。DNA 是您细胞中的代码。它是我们尝试理解的最丰富但也最复杂的信息宝库。大约 30 亿个 DNA 个体字母,大致组织成 23 对染色体——尽管其中一对染色体有一半时间不是一对(男性是 XY,女性是 XX)。DNA 排列在大约 20,000 个基因中(即使关于基因的定义实际上是什么仍然存在争议)。而且,几乎您所有的 DNA(97%)都不是基因,而是一系列控制区域、支架和大量重复片段的混合物。其中一些只是垃圾,是数十亿年进化遗留下来的。
现代遗传学揭示了一幅极其复杂的图景,我们还没有完全理解——尽管我们当然已经远离了孟德尔和他的豌豆实验,这些实验首次确定了我们称为基因的遗传单位。在 20 世纪的整个过程中,我们牢牢掌握了生物遗传学的基础知识:基因如何从一代传递到另一代,以及它们如何编码构成或构建所有生命的蛋白质。在 1980 年代,我们鉴定了已经突变的基因,这些基因制造出有缺陷的蛋白质,这可能会导致可怕的疾病,例如囊性纤维化或肌营养不良症。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们当今世界的发现和想法的有影响力的故事的未来。
到 2003 年,人类基因组计划已经完整地交付了人类 DNA 序列。该努力最重要的副产品之一是技术的出现,该技术使我们能够以前所未有的速度和不断降低的成本读取 DNA。我们现在可以廉价地泵出数十万人的基因组,并且通过这些数据,我们可以更深入地了解遗传、进化和疾病的深刻问题。人类基因组中实际上存在无限的变异,而仔细检查我们的 DNA 有助于我们理解是什么使我们成为人类,既是作为一个物种,也是作为个体。
随着基因测序成本的暴跌,商业利益随之而来。突然之间,任何公司都可以开设店铺,并通过一些现金和一小瓶唾液,从您口腔中的细胞中提取您的 DNA 并对您的基因组进行测序。除了巨头 23andMe 和 AncestryDNA 之外,数十家公司也这样做了。
关于其结果的准确性问题,存在两个潜在问题。第一个问题有点琐碎:测序是否做得好?在批评这项业务时,似乎可以合理地假设生成的数据是准确的。但是,也出现了一些奇怪的失败案例,例如,一家公司未能识别出样本 DNA 不是来自人类,而是来自狗。最近的一项分析发现,当重新分析原始数据时,来自“直接面向消费者”(DTC) 基因测试的与特定疾病相关的变异中有 40% 被证明是假阳性。
假设测试是准确完成的,公司 DNA 数据库的差异仍然可能导致一些差异。几乎每个 DTC 基因测试都不会对您的整个基因组进行测序,而是查看您 DNA 中已知感兴趣的位置。当我接受 23andMe 测试时,他们宣布我不携带与红头发密切相关的基因版本。另一家血统公司说我有。这仅仅反映了一个事实,即一家公司正在查看编码姜黄色头发的基因的不同变体。
如果我们假设生成的数据是准确的,那么出现的第二个问题是关于解释。而这才是变得模糊不清的地方。您 DNA 中许多感兴趣的位置是通过称为全基因组关联研究或 GWAS(发音为 gee-woz)的实验确定的。选取一大群人,尽可能多,他们具有共同的特征。这可能是一种疾病,例如囊性纤维化 (CF) 或正常特征,例如红头发。当您对他们的所有基因进行测序时,您会寻找他们 DNA 中在测试组内比在另一个人群中更相似的个体位置。对于 CF,您会在 7 号染色体上看到一个很大的峰值,因为大多数 CF 病例是由一个基因的突变引起的。对于红发,您会在彼此非常接近的地方看到 16 或 17 个峰值,因为同一个基因中有多个变体,所有这些变体都赋予了姜黄色的头发。但是对于像味觉或与饮食或运动相关的复杂特征,将会出现数十个变体,并且所有这些变体都仅提供一种概率,表明由于您的 DNA(在人群中测量)而导致对某种行为的倾向。这甚至适用于像眼睛颜色这样看似简单的事情:与蓝眼睛相关的基因变体仍然只是您会拥有蓝眼睛的可能性,并且完全有可能拥有两个蓝眼睛基因但没有蓝眼睛。
遗传学是一门概率科学,没有任何基因是“为了”任何特定的东西而存在的。我对指示个体在临床环境之外对某些疾病的倾向的基因测试的效用持严重保留意见;如果您没有遗传学博士学位,这些结果可能会产生误导,甚至令人不安。即使像我一样,您携带一个增加患阿尔茨海默病概率的基因版本,大多数携带这种变体的人也不会患上这种疾病,这种疾病也受到许多生活方式选择和一些盲目运气的深刻影响。遗传学家可以告诉您的关于此信息的事情很少,这些信息会超过标准的生活方式建议:不要吸烟、均衡饮食、定期锻炼并涂抹防晒霜。
当谈到血统时,DNA 非常擅长确定近亲关系,例如兄弟姐妹或父母,并且正在涌现数十个重新团聚或识别失散近亲(或实际上是罪犯)的故事。对于更深层次的家族根源,这些测试实际上并没有告诉您您的祖先来自哪里。他们说今天在地球上可以找到像您这样的 DNA 的地方。通过推断,我们假设我们深层家族的很大一部分来自这些地方。但是说您有 20% 的爱尔兰血统、4% 的美洲原住民血统或 12% 的斯堪的纳维亚血统是很有趣的、琐碎的,并且几乎没有科学意义。我们都有成千上万的祖先,并且随着时间的推移,我们的家谱变成了错综复杂的网络,这意味着不久之后,我们的祖先就会成为每个人的祖先。人类的亲缘关系非常密切,DNA 不会告诉您任何关于您的文化、历史和身份的信息。