2013年11月26日

计算材料科学的黄金时代？一种不安的似曾相识感

在20世纪80年代初，当他们宣布“计算药物设计的黄金时代”时，我还是个蹒跚学步的幼儿。现在我可能还是个幼儿，但我经常从这个领域中带着迷茫眼神的老兵那里听到关于即将到来的黄金时代的故事。

本文发表于《大众科学》的前博客网络，反映作者的观点，不一定反映《大众科学》的观点

在20世纪80年代初，当他们宣布“计算药物设计的黄金时代”时，我还是个蹒跚学步的幼儿。现在我可能还是个幼儿，但我经常从这个领域中带着迷茫眼神的老兵那里听到关于即将到来的黄金时代的故事。《财富》杂志的一篇封面故事（我似乎永远无法在网上找到）宣布，制药科学家现在正在计算机上设计药物。其想法是，一旦你输入药物在人体内的行为参数，计算机就会简单地给出答案。唯一的障碍是受硬件和软件进步限制的计算能力。文章似乎暗示，只要给它足够的时间，身穿白大褂的实验室科学家可能会成为历史的遗迹。未来看起来一片光明，充满希望。

快进到2013年的暮年。我们仍在等待计算药物设计的黄金时代。药物发现和设计的大部分工作仍然由身穿白大褂的实验室科学家完成。现在让我们明确一件事：自20世纪80年代以来，该领域的计算方面取得了巨大进步，并且它仍在蓬勃发展。毫无疑问，总有一天它对药物设计的贡献将被视为实质性的。大多数药物通过与特定蛋白质结合在生物系统中发挥其魔力，而计算药物设计现在已经足够胜任，它可以相当准确地预测药物分子结合在蛋白质深处的结合口袋中的结构和方向。计算科学家现在可以对药物的结构提出有用的修改建议，实验室化学家可以进行这些修改以改善多种特性，包括溶解度、跨细胞膜的扩散能力、细胞内的活性以及避免被体内酶分解的能力。你很难找到一个计算建模没有至少发挥一定作用的药物设计项目。将今年的诺贝尔化学奖授予计算化学家只是该领域取得多大进展的一个标志。

然而，计算药物设计师似乎正面临着与 80 年代完全相同的基本挑战。他们在理解这些挑战方面肯定取得了进展，但可靠的预测仍然是未来的事情。他们正在处理的最重要的问题与 80 年代处理的问题相同：你如何解释蛋白质-药物系统中的水？你如何计算熵？你如何预测蛋白质的折叠结构？你如何计算药物分子在体内水性环境中采用的不同结构？你如何修改一种药物化合物，使其能够抵抗外来分子入侵的细胞不会直接将其排出？你如何预测药物和蛋白质之间结合能的绝对值？尽管软件和硬件取得了巨大的、数量级的改进，但科学家们仍在努力解决这些问题。

关于支持科学新闻

如果你喜欢这篇文章，请考虑通过以下方式支持我们屡获殊荣的新闻报道：订阅。通过购买订阅，你正在帮助确保有关当今塑造我们世界的发现和想法的具有影响力的故事的未来。

我说这些是因为本月《大众科学》一篇关于计算材料设计的封面故事让我感到不安的似曾相识感。这篇文章由两位科学家撰写，他们热情地谈论一个项目，该项目的目标是为每种可能的应用列出计算出的材料特性：从汽车中的轻质合金到太阳能电池的新材料，再到将耗散的热量转化为电能的热电材料。作者们确信，我们现在正接近计算材料设计的黄金时代，其中材料特性的高通量预测将使我们至少加快新型材料的制造速度。

我们现在可以利用一个世纪以来在物理学和计算方面的进步，超越爱迪生式的过程（反复试验）。计算机处理能力的指数级增长，再加上沃尔特·科恩和已故的约翰·波普尔在 20 世纪 60 年代和 70 年代所做的工作，他们开发了量子力学方程的简化但精确的解决方案，使得利用超级计算机和第一性原理物理学从头开始设计新材料成为可能。该技术被称为高通量计算材料设计，其思想很简单：使用超级计算机一次虚拟研究数百或数千种化学化合物，快速有效地寻找新材料的最佳构建模块，无论是电池电极、金属合金还是新型半导体。

这听起来当然很乐观。然而，这篇文章似乎大谈可能性，却缺乏实质和缺点。这可能是因为它在杂志中仅占三页；我认为它应该占用更多的篇幅，尤其是对于封面文章。就目前的情况而言，这篇文章显得比谨慎的乐观主义更像是一厢情愿。

我赞赏构建计算材料特性数据库的努力，但我对这种知识在不久的将来如何用于设计新材料持更加悲观的态度。我不是材料科学家，但我认为该学科的计算端面临的一些问题与任何计算化学家面临的问题相似。正如文章指出的那样，用于材料设计的主要工具是主要由约翰·波普尔和沃尔特·科恩在 20 世纪 70 年代开发的基于量子力学的化学方法，这一发现使两人获得了 1998 年的化学诺贝尔奖。从那时起，这些方法就被编码到数十个高效、用户友好的计算机程序中。然而，这些方法——尽管它们基于第一性原理——速度却非常慢。即使有强大的计算能力，也可能需要几天时间才能对原子晶格进行详细的量子力学计算。对于涉及数百个原子和扩展框架的材料，则需要更长的时间。

我尤其不相信这些方法能够实现快速、高通量的计算，从而取代实验的反复试验。我感到悲观的一个原因是预测晶体结构的巨大困难。问题如下：材料的特性取决于其原子在明确的晶格中的几何排列。根据条件（温度、压力、溶剂），材料可以以数十种可能的结构结晶，这使得假设“一个”晶体结构的练习变得徒劳。更糟糕的是，对于计算机计算而言，这些结构之间的能量差异可能很小，在许多理论技术的误差范围内。

另一方面，错误的晶体结构可能会给我们带来错误的特性。因此，对于任何类型的计算预测方法，其挑战是双重的：首先，它必须预测给定材料可以采用的各种可能的晶体形式（有时这个数字可能高达数百个）。其次，即使它能够实现此列表，它现在也必须按能量顺序对这些晶体形式进行排序，并预测哪个将是最稳定的晶体形式。由于各种形式之间的能量差异很小，即使是对单一材料进行详细计算，这也将是一个严峻的挑战。将温度、压力和溶剂条件纳入计算将使计算成本更高。在我看来，以高通量的方式对数十或数百种材料进行所有这些工作将是一项充满延迟和错误的努力。这肯定会做出推进该领域的极其宝贵的智力贡献，但我看不出我们如何能够接近实际和廉价地使用此类计算来设计复杂的新材料，其速度至少与实验相当。

我预见的第二个问题是一个常见的问题，几乎任何科学家或工程师都称之为多参数优化问题。我们在药物设计领域一直面临这个问题；我们不仅需要优化药物在细胞内的活性，而且还需要同时优化其他关键特性，如稳定性、毒性和溶解度，甚至在更高层次上，还需要优化非科学特性，如价格和用于制造药物的起始材料的可用性。优化这些特性中的每一个都将是一场艰苦的战斗，但同时优化所有这些特性（或至少在给定的时间优化两个或多个特性）会耗尽最优秀的科学家和计算机的智慧和资源。我假设新材料也必须满足类似的多重特性；例如，用于汽车的新合金必须是轻质的、对环境无害的、对热和光稳定的并且廉价的。药物发现仍然如此困难的主要原因之一就是这个多参数优化问题，我看不出在计算层面上材料科学的情况会有什么不同，特别是如果大多数技术都涉及昂贵的量子力学计算。

加快计算速度的一种方法——这也是我希望在文章中读到的——是使用廉价的、基于经典力学的参数化方法。在这些方法中，你可以通过在经典模型中使用来自实验的参数来简化问题，该模型通过实验确定的变量隐式地包含量子效应。虽然这些计算很便宜，但它们也可能导致更大的误差，尽管对于更简单的系统，它们几乎与详细的量子计算一样有效。在我看来，他们正在构建的这个属性数据库可以通过实验值来支持，并用于构建参数化的、更便宜的模型，这些模型实际上可以以高通量的能力使用。

所有这些是否让我对计算材料设计的未来感到悲观？一点也不；我们才刚刚起步，这个领域需要大量有才华的科学家涌入。计算药物设计遵循了经典的技术曲线，经历了过高的期望，随之而来的是失望的低谷，最终达到了现实评估的平台期。也许计算材料设计也会发生类似的情况。但我认为说我们正在进入黄金时代是错误的。我们可能正在试水，为令人满意的一跃做好准备。这应该被称为“试水”，而不是成功地游过材料的河流。我祝愿那些勇于尝试的人一切顺利。