DNA标签助力药物搜寻

药物发现是一个艰巨的过程,需要化学家筛选数百万种化学物质才能找到一个有效分子。DNA技术可以大大加快搜索速度

DNA

药物发现通常始于研究人员组装大量的化学物质库,然后针对目标蛋白质进行测试。

©iStock

在马萨诸塞州沃尔瑟姆市一栋混凝土建筑二楼一个普通的实验室冰柜里,放着一个塑料盒,里面装着一个透明的试管,里面装着一种天文数字比例的混合物。冷冻在其中的化学物质库,是伦敦制药公司葛兰素史克(GSK)拥有的化合物集合,包含多达1万亿个独特的DNA标记分子——是银河系中恒星数量的十倍。

这个和其他类似的库正在帮助制药公司和生物技术公司快速识别可以与疾病相关的蛋白质结合的候选药物,特别是那些已被证明难以靶向的蛋白质。它们使得筛选的进行速度更快、成本更低,远胜于传统方法。学术科学家也可以利用它们来探索基础生物学问题,并研究酶、受体和细胞通路。

药物发现通常始于研究人员组装大量的化学物质库,然后针对目标蛋白质进行测试。将化合物单独添加到含有靶标的孔中,以查看它们是否会影响其活性。这种方法称为高通量筛选(HTS),它使用机器人设备实现自动化,可以测试数百万种化学物质,但它仍然费力、昂贵,而且并不总是成功。


支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保关于塑造我们当今世界的发现和思想的有影响力的故事的未来。


在过去的几年里,药物化学家通过用条形码式的DNA片段标记化合物,增加了发现潜在有用化合物的可能性。这些DNA编码库——可以超过传统的的小分子库——为药物发现提供了各种优势。首先,研究人员可以将所有DNA标记的小分子放入单个混合物中,而不是单独测试每种化合物,然后引入目标蛋白质。任何与目标结合的化合物都可以通过其DNA条形码轻松识别。

DNA编码库最早于1992年由分子生物学家悉尼·布伦纳和化学家理查德·勒纳提出,他们在加利福尼亚州拉霍亚的斯克里普斯研究所进行了一项思想实验。从那时起,它们一直在发展壮大。2007年,葛兰素史克以5500万美元收购了沃尔瑟姆市的一家开创这些库的公司Praecis Pharmaceuticals。位于瑞士巴塞尔的制药公司诺华和罗氏也已经启动了自己的内部DNA编码库项目。与此同时,一个新兴的生物技术公司群体——包括沃尔瑟姆的X-Chem、哥本哈根的Vipergen、马萨诸塞州剑桥的Ensemble Therapeutics和瑞士苏黎世的Philochem——已经建立了一个渴望使用该技术的行业和学术合作伙伴名单。

“人们现在明白这并不是一种潮流,”马萨诸塞州波士顿阿斯利康化学创新中心执行主任罗伯特·古德诺说,该中心与X-Chem合作。“这是真的。”

DNA编码库不会取代高通量筛选:公司已经在高通量筛选上投入了大量资金,而且有些化合物无法使用DNA编码技术合成。相反,它们提供了一种互补的方法,可以快速、高效且廉价地找到与新的或历史上具有挑战性的靶点结合的化学结构,例如泛素连接酶,它可以标记蛋白质以进行处理,并可能在癌症治疗中发挥作用。

大就是美

葛兰素史克目前拥有世界上最大的DNA编码库:它比该公司拥有200万种化合物的高通量筛选库大50万倍,令人印象深刻。

有几种方法可以构建DNA编码库:最大的库,如葛兰素史克的库,是使用一种称为“DNA记录”的方法构建的。化学构件,如氨基酸、胺和羧酸,被合成,然后通过化学反应用独特的DNA条形码标记。将第二个构件添加到混合物中以制造新的小分子,然后延长DNA条形码。通过连接多达四个模块,化学家可以创造出类药物分子。而且由于他们有数千个构件可以使用,潜在的组合数量是巨大的。

与传统的需要化学家单独测试每种化合物的高通量筛选库相比,DNA编码库更易于维护和使用。DNA编码库可以存储在一个试管中,而高通量筛选库需要足够大的机器人填充设施来单独存储每种化合物。

但葛兰素史克在沃尔瑟姆的经理克里斯·阿里科-穆恩德尔说,DNA编码库的真正美妙之处在于它可以合成的化学结构数量之多。该公司的药物发现团队现在使用DNA编码库的频率与高通量筛选库一样频繁,如果不是更频繁的话,用于新的和难以靶向的蛋白质目标。迄今为止,该公司DNA编码库中最先进的化合物是GSK2256294,它可以阻断环氧化物水解酶,这是一种参与分解脂质的酶。这种候选药物来自葛兰素史克与Praecis的合作,并已完成首次人体安全性研究,这些研究可能支持进一步评估其在糖尿病、伤口愈合或作为慢性阻塞性肺疾病的治疗中的应用。“我们对DNA编码库在葛兰素史克内部的进展感到满意,”阿里科-穆恩德尔说。

随着越来越多的化学构件被创造出来,以及将它们彼此连接的更多方法,这些库的广度将继续扩大。

X-Chem首席执行官理查德·瓦格纳说,在不久的将来,DNA编码库不仅会变得更大更广,还可能提供可以快速进入临床试验的靶点。在传统的筛选中,药物化学家有时必须花费多年时间来调整化合物,使其具有足够的特异性、效力和安全性,才能进入临床试验。“这只是一场概率游戏,”瓦格纳说。相比之下,DNA编码库的大尺寸意味着,偶然地,它们所包含的一些化合物将比其他化合物更适合临床使用。尽管化合物仍需要优化,“我们可以得到非常接近的东西”,他说。

X-Chem在其DNA编码库中拥有1200亿种化合物,该公司已经开始在实践中看到这一点。该公司仅用了一年的时间就将其最先进的候选药物——一种阻止一种磷脂转化为另一种磷脂的自吐酶抑制剂——从筛选靶点推进到了临床候选药物。X-Chem的一家衍生公司X-Rx位于北卡罗来纳州威明顿,该公司计划于2017年开始对该化合物进行纤维化临床试验。业界对X-Chem的库的兴趣正在蔓延:在过去的五年里,该公司与包括罗氏、阿斯利康、拜耳、强生、辉瑞和赛诺菲在内的几家大型制药公司,以及许多生物技术和学术合作伙伴建立了合作和许可协议。

按需定制

其他生物技术公司增加了一个有趣的转折。它们不仅使用DNA标签来识别化合物,还将其用作制造化合物的模板。哈佛大学化学家大卫·刘和他的学生开发了这种“DNA模板化”方法,并用它构建了一个名为大环分子的环形分子库。这些更大、更稳定的环形分子在多个位点与靶标相互作用,增强了结合反应的特异性。(葛兰素史克和X-Chem也在其DNA编码库中拥有大量的大环分子集合。)

刘首先创建了充当向导的单链DNA模板——这些模板由与他的化学构件上的DNA标签互补的几个区域组成。然后,他按顺序将DNA标记的构件添加到反应容器中,依靠DNA碱基配对来物理地将标记的构件足够靠近在一起以彼此结合。然后,最后一步反应将一连串的构件转化为环,产生每个都与独特的DNA条形码相连的大环分子。

构建DNA模板化库涉及大量的工作,因为研究人员必须为每个分子设计一个模板,并用DNA标记数千个构件。因此,DNA模板化库比DNA记录库小,但它们在尺寸方面仍然超过了高通量筛选库,并且它们也有其他优势。由于科学家从一开始就知道他们正在生产什么化合物,他们可以纯化DNA模板化库,以去除标记不准确的化合物。这一步骤转化为对靶点的高度信任。相比之下,巨大的DNA记录库可能仍然包含错误标记的化合物,因此可能会产生一些会使研究人员进行徒劳无功的追逐的靶点。

刘的14,000个分子的库已经取得了一些胜利。2014年,他的团队报告说,当他们发现一种可以阻断与2型糖尿病相关的胰岛素降解酶(IDE)的特异性和稳定的小分子时,他们解决了研究人员数十年来一直在努力解决的问题。他和其他人已经开始揭示IDE在健康和疾病中的作用,这导致了其他IDE抑制剂的鉴定。目前正在讨论将其开发成药物。

刘还筛选了100多个其他靶点,其中许多是由需要他们感兴趣的蛋白质的小分子抑制剂的学术合作者带给他的。“我从来没有想到七年后,第一代库仍然会为我们提供有趣的生物学发现,”他说。“但它已被证明是非常富有成效的。我们从我们的第一个库中获得的靶点比我们能够跟进的还要多。”

然而,他正在完成第二代256,000个大环分子的库的最后润色,这可能会开启更多的生物学研究。刘于2004年创立的Ensemble Therapeutics公司现在在其库中拥有超过1000万个大环分子。该公司专注于免疫检查点蛋白质(调节免疫系统)和泛素连接酶中的靶点。它还授予了诺华公司一项许可,以开发其发现的其中一种分子,该分子靶向与炎症相关的蛋白质白细胞介素-17。

甜蜜筛选

一旦构建好化合物库,接下来有趣的事情就开始了,那就是找出哪些分子会粘附到靶标上。大多数研究人员依赖于“亲和力筛选”来寻找这些化合物。为此,他们会对蛋白靶标进行改造,使其包含一个纯化标签。然后,他们将包含化合物库和靶标的混合物通过纯化柱,利用纯化标签将结合的配对物拉出。最后一步是使用 DNA 测序仪读取与小分子连接的 DNA 标识符。

即使只有极少量的靶蛋白,这种方法也能产生结果。Arico-Muendel 回忆说,在一个项目中,学术合作者希望筛选一种不稳定的蛋白质,他们只能少量生产。“他们把它放在干冰中连夜运到这里,我们立即对它进行了整个筛选,”他说。“结果确实得到了一些非常好的命中。”这种实验对于高通量筛选 (HTS) 来说是不可能实现的,因为靶蛋白必须足够稳定和丰富,才能在实验开始前添加到数百万个孔中。

但是,基于亲和力的筛选也有其缺点。笨重的 DNA 标签有时会阻碍与靶标的相互作用,并且可能会丢失一些潜在的候选物。但是,由于 DNA 编码的化合物库非常庞大,筛选人员通常不会太担心这些损失。更成问题的是,小分子及其标签可能会结合到纯化柱上,从而产生假阳性命中。纯化标签也可能干扰靶蛋白的结构,从而给数据引入混淆。

一些研究小组已经开发出解决这个问题的方法。Vipergen 是一家生物技术公司,拥有一种含有 5000 万个分子的 DNA 模板化合物库,该公司将希望寄托在“结合剂捕获富集”策略上。

该公司首席执行官 Nils Hansen 说,想象一下,你可以冻结你的蛋白质-化合物库混合物,并将其切成超小的冰块。如果冰块足够小,每个冰块将只能包含单个靶蛋白。在这种大小下,即使没有纯化策略,结合靶标的小分子也会在包含靶标的冰块中始终过度表达。Vipergen 通过将其筛选放入水油乳液中实现了相同的效果,其中微小的水滴代替了冰块。“这很酷,”Hansen 说。

目前,DNA 编码的化合物库筛选最适合自由漂浮的可溶性蛋白质。但是,许多有吸引力的药物靶标都嵌入细胞表面,这使得它们无法使用传统的基于亲和力的筛选方法进行探测。例如,据估计,40% 的已批准药物靶向膜结合 G 蛋白偶联受体,这些受体感知细胞外的分子。Goodnow 说,用于筛选膜结合蛋白的技术正在发展,“但仍然是一种挑战”。

一种前进的方法是将 DNA 编码的化合物库与过度表达膜结合靶标的完整细胞混合。然后,小分子可以结合到细胞表面的靶标上。在研究人员洗去未结合的化合物库后,他们可以通过加热细胞并读取洗脱的 DNA 标签来识别结合的小分子命中。葛兰素史克公司已经使用这种方法来识别一种与精神分裂症和中枢神经系统疾病有关的受体的强效抑制剂。

X-Chem 也开始在膜结合蛋白的筛选中取得成功。“从历史上看,我们的大部分项目都是针对可溶性蛋白质的。但是,鉴于我们最近能够从非常困难的膜结合蛋白中产生的数据,情况正在发生变化,” Wagner 说。

随着 DNA 编码的化合物库不断扩大,以及新的筛选方法开辟了未知的生物空间,他补充说,“DNA 编码的化合物库有望成为制药行业发现的支柱之一。”

本文经许可转载,并于 2016 年 2 月 18 日首次发表

First published in 1869, Nature is the world's leading multidisciplinary science journal. Nature publishes the finest peer-reviewed research that drives ground-breaking discovery, and is read by thought-leaders and decision-makers around the world.

More by Nature magazine
© . All rights reserved.