本文发表于《大众科学》的前博客网络,反映了作者的观点,不一定代表《大众科学》的观点
对大多数人来说,夏季阅读意味着杂志、小说和类似的消遣读物,但对我来说,它是《美国人类遗传学杂志》(AJHG)。浏览当前一期的目录告诉我,后基因组时代的主导内容是什么:超越显而易见的信息,隐藏在 A、C、T 和 G 序列中的潜台词。
在 20 世纪 60 年代破解遗传密码(DNA(实际上是 RNA)三联体与生物蛋白质中 20 种氨基酸之间的对应关系)之后的几十年里,“一个基因-一个蛋白质”的思维模式指导了遗传研究。研究人员使用间接方法将基因定位到染色体,然后费力地进行基因-蛋白质分配,一次描述一种罕见的单基因疾病。
我回顾了过去几十年同期《AJHG》的期刊,以了解当前期刊的视角。1982 年 9 月的期刊中有 4 条人类染色体的粗略连锁图,当时人类基因组计划的想法尚未提出。在接下来的十年里,更多熟悉的单基因疾病背后的基因开始显现出来:强直性肌营养不良症、囊性纤维化、杜氏肌营养不良症、第一种成骨不全症,以及难以捉摸的亨廷顿病等等。
关于支持科学新闻
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和想法的有影响力的故事的未来。
2002 年的《AJHG》首次暗示了超越单基因方法的趋势,“全基因组”和“关联”进入了语言,很快就与 GWAS(全基因组关联研究)结合在一起,直到最近被全外显子组测序所取代。文章涉及 SNP 和易感性,描述了基因的非氨基酸编码部分的突变,并包括更多受环境影响的性状和疾病,如身高和双相情感障碍。
现在,2012 年 8 月号的语气和内容突出了 DNA 中的信息如何远远超出“一个基因-一个蛋白质”。以下是一些隐藏的含义
• 一种导致肌萎缩侧索硬化症 (ALS) 的突变基因也导致原发性震颤。在 ALS 中,一种改变氨基酸的错义突变会在运动神经元中滞留并做一些事情——我们仍然不知道是什么——导致细胞关闭。但在原发性震颤中,这种突变是无义的,它会阻止蛋白质的产生,并激活一个细胞垃圾处理途径,该途径会清除不完整的蛋白质,从而造成较小的严重后果。(该基因 FUS 仅占 10% 的遗传性 ALS 病例中的 4%)。
• 第五种成骨不全症(“脆骨病”)源于蛋白质编码序列之前的控制 DNA 序列中的突变。因此,突变不是拼写“准备开始”,而是将五个氨基酸添加到 132 个氨基酸的蛋白质上。该基因逃过了经典的连锁研究,甚至人类基因组计划的桑格测序。
• “肺癌易感性和预后的潜在生物标志物”在于,在名为MAPKAPK2的基因的启动子控制区域中,具有 4 个特定重复序列的拷贝,而不是具有 2 或 3 个拷贝。
• 不要忘记染色体!除了精子和卵子外,我们每个人在所有细胞中都有两个基因组副本。如果一个人在致病基因中有两个隐性突变,则可能意味着两种情况:如果缺陷位于同一染色体的不同拷贝上(“反式”结构,从父母双方遗传),则可能生病;但如果突变位于同一染色体上的同一基因内(“顺式”结构,从父母一方遗传),则不会生病。遗传学家长期以来在大家庭中推断出顺式和反式“相位”效应,但对于当今数千人的多重基因分型,这项任务变得更加艰巨。现有的统计方法从最常见的情况中推断出相邻序列,构建沿染色体紧密连接的基因变体的“单倍型”——但来自博德研究所的 David Reich 小组在 8 月的 AJHG 中描述了一种强大的新方法,该方法不是从已知内容中推断出来的。
我特别关注遗传学期刊的目录,因为自 1993 年以来,我一直是人类遗传学教科书的作者。以上四种现象并不新鲜——只是自从基因组计划揭示了蛋白质编码序列,即仅占 2% 的外显子组以来才被阐明。但我的教科书的下一版可能会改变的不是包含什么,而是排除什么,或者更确切地说是谁:遗传学的“父亲”——格雷戈尔·孟德尔。
生物学教师的邮件列表最近就孟德尔的命运展开辩论,灵感来自不列颠哥伦比亚大学的罗斯玛丽·雷德福的一篇文章“我们为什么要学习这些东西?”——为 20 世纪学生提供的新遗传学。在人们可以通过互联网订购 DNA 测试的今天,一些人说,1865 年发表的著名的豌豆植物实验不再相关,甚至不再有趣。另一些人反对将孟德尔视为遗传学的伽利略的民间传说,即被误解的英雄在他的修道院花园里不知疲倦地工作,然后他的工作被忽视了。
因此,关于这位僧侣和高矮豌豆植物及其皱纹和圆形、绿色和黄色豌豆的精美插图的故事,这些插图在我的教科书的第 4 章中已经使用了 10 个版本,可能在第 11 版中被埋在附录中。因为在这个后基因组时代,无论是在我们基因组的显而易见还是不那么显而易见的领域,都有太多其他东西需要发现。对于所有科学来说,情况也是如此——每当我们取得巨大飞跃时,例如对人类基因组进行测序,我们发现我们实际上还有很多东西要学习。