数字模拟人脑中每一个神经元的倒计时

构建庞大的大脑数字模拟模型可以改变神经科学和医学,并揭示制造更强大计算机的新方法

还原论生物学——检查单个大脑组成部分、神经回路和分子——已经使我们取得了长足的进步,但仅凭它自身无法解释人脑的运作方式,人脑是我们颅骨内的一个信息处理器,在宇宙中可能是无与伦比的。我们必须像还原一样构建,像解剖一样建造。为了做到这一点,我们需要一种结合分析和综合的新范式。还原论之父,法国哲学家勒内·笛卡尔写道,有必要研究各个部分,然后重新组装它们以重建整体。

将事物组合在一起,设计出人脑的完整模拟模型,这是一项旨在构建一种奇妙的新科学仪器的任务的目标。目前还没有完全类似的东西,但我们已经开始构建它。思考这个仪器的一种方式是将其视为有史以来最强大的飞行模拟器——只不过它模拟的不是在开放空间中的飞行,而是模拟大脑中的航行。这个“虚拟大脑”将在超级计算机上运行,并整合神经科学迄今为止产生的所有数据。

数字大脑将成为整个科学界的资源:研究人员将像在最大的望远镜上一样,在上面预留时间进行实验。他们将使用它来测试关于人脑在健康和疾病状态下如何运作的理论。他们将利用它来帮助他们开发新的自闭症或精神分裂症诊断测试,以及抑郁症和阿尔茨海默病的新疗法。数万亿神经回路的布线图将启发类脑计算机和智能机器人的设计。简而言之,它将改变神经科学、医学和信息技术。


关于支持科学新闻报道

如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保关于塑造我们今天世界的发现和想法的有影响力的故事的未来。


盒子里的脑袋
科学家们可能在本十年末开始运行人脑的首次模拟,届时超级计算机将足够强大,能够支持所需的大量计算。该仪器不需要首先解开大脑的所有谜团。相反,它将提供一个框架来容纳我们已知的东西,同时使我们能够对我们不知道的东西做出预测。这些预测将告诉我们未来实验的目标,以防止浪费精力。我们产生的知识将与现有知识相结合,框架中的“漏洞”将以越来越真实的细节填补,直到最终,我们将拥有一个统一的、工作的大脑模型——一个从整个大脑到分子水平都能准确再现它的模型。

构建这个仪器是人类大脑计划 (HBP) 的目标,该计划涉及全球约 130 所大学。HBP 是六个项目之一,它们正在竞争一个耀眼的奖项,欧洲联盟将在 10 年内为每个获奖者提供高达 10 亿欧元的奖金,获奖者将于 2013 年 2 月宣布。

我们需要模拟器至少有两个原因。仅在欧洲,脑部疾病就影响了 1.8 亿人,约占三分之一——随着人口老龄化,这个数字还将继续增长。与此同时,制药公司并没有投资于新的神经系统疾病治疗方法。对大脑的整体看法将使我们能够用生物学术语重新分类这些疾病,而不是仅仅将它们视为一系列症状。这种视角的广度将使我们能够向前发展,开发一代有选择性地针对潜在异常的疗法。

第二个原因是计算机技术正迅速接近进一步发展的障碍。尽管处理能力不断提高,但计算机无法完成动物大脑轻松完成的许多任务。例如,尽管计算机科学家在视觉识别方面取得了巨大进步,但机器仍然难以利用场景中的上下文,或者像大脑那样利用任意的信息碎片来预测未来事件。

此外,由于更强大的计算机需要更多的能量,有一天满足它们的需求将不再可行。当今超级计算机的性能以每秒千万亿次逻辑运算来衡量。下一代超级计算机预计在 2020 年左右问世,速度将快 1000 倍,并将以每秒百京次运算来衡量。仅第一台百京级机器可能就会消耗约 20 兆瓦的电力,大致相当于冬季一个小镇的能源需求。为了创造越来越强大的计算机,以节能的方式执行人类能够胜任的一些简单但有用的事情,我们需要一种全新的策略。

我们可以从人脑中汲取灵感,这总比情况更糟,人脑仅用约 20 瓦的功率就能执行一系列智能功能——比百京级机器少一百万倍,相当于一个弱灯泡。为此,我们需要了解大脑的多层次组织,从基因到行为。知识就在那里,但我们需要将它们整合在一起——我们的仪器将提供实现这一目标的平台。

批评者说,模拟人脑的目标是无法实现的。他们的主要反对意见之一是,不可能重现大脑 100 万亿个突触之间的连接,因为我们无法测量它。他们说我们无法测量连接网络是正确的,这就是为什么我们不打算测量——至少,不是全部。我们打算通过不同的方式重现脑细胞之间无数的连接。

我们方法的关键是根据大脑的构建方式来设计基本蓝图:指导其进化过程中构建以及在每个发育中的胎儿中重新构建的一组规则。理论上,这些规则是我们开始构建大脑所需的所有信息。怀疑论者是对的:它们产生的复杂性令人望而生畏——因此我们需要超级计算机来捕捉它。但是,解开规则本身是一个更容易处理的问题。如果我们成功了,就没有逻辑理由说明我们不能像生物学那样应用蓝图,并构建一个“计算机内”的大脑。

我们所说的规则是指控制基因的规则,这些基因导致大脑中存在的细胞类型,以及这些细胞分布方式和连接方式的底层计划。我们知道这些规则是存在的,因为我们在为 HBP 奠定基础时发现了一些规则。我们大约在 20 年前开始这样做,通过测量单个神经元的特征。我们收集了大量关于不同神经元类型的几何特性的数据,并在三维空间中以数字方式重建了数百个神经元。使用一种称为膜片钳的细致方法,该方法涉及将微型玻璃移液管的尖端靠在细胞膜上,以测量其离子通道的电压,我们还记录了神经元的电特性。

在 2005 年,模拟单个神经元需要一台强大的计算机和一个为期三年的博士项目。然而,很明显,更宏伟的目标很快就会实现,即使我们对这些元素的了解不完整,我们也可以模拟更大的大脑回路元素。在洛桑瑞士联邦理工学院的大脑思维研究所,我们启动了 HBP 的前身之一,蓝色大脑项目。我们将构建我们称之为“统一计算机模型”的模型——这些模型整合了关于给定大脑回路的所有现有数据和假设,同时协调信息中的冲突并突出知识的不足之处。

综合生物学
作为一个测试案例,我们着手构建一个称为皮质柱的大脑结构的统一模型。柱相当于您笔记本电脑中的处理器。用一个粗略的比喻来说,如果您要将一个微型苹果去核器穿过皮层,并拔出一个直径约半毫米、高度 1.5 毫米的组织柱,那将是一个柱。在该组织核心内,您会发现一个非常密集的网络,由数万个细胞组成。柱是一种如此高效的信息处理元件设计,以至于一旦进化找到了公式,它就会一遍又一遍地应用这个配方,直到颅骨中没有更多空间,皮层不得不向内折叠以创造更多空间——因此,您的大脑才会如此复杂。

柱穿透新皮层的六个垂直层,新皮层是皮层的外层,它与大脑其余部分的神经连接在每一层中都以不同的方式组织。这些连接的组织方式类似于电话呼叫被分配一个数字地址并通过交换机路由的方式。一个柱中驻留着数百种神经元类型,我们使用 IBM 蓝色基因超级计算机,整合了所有关于这些类型如何在每一层中混合的可用信息,直到我们得到了新生大鼠柱的“配方”。我们还指示计算机允许虚拟神经元以真实神经元的所有方式连接——但仅以这些方式连接。我们花了三年时间构建软件设施,这反过来又使我们能够构建这个第一个柱的统一模型。有了它,我们就有了我们称之为综合生物学的概念验证——从全面的生物学知识中模拟大脑——以及它如何作为一种可行且具有创造性的新研究方式。

那时,我们有了一个静态模型——相当于昏迷大脑中的柱。我们想知道它是否会开始像真实的柱一样运作,尽管它与活体脑组织切片中的大脑其余部分隔离,所以我们给它一个冲击——一些外部刺激。在 2008 年,我们对我们的虚拟柱施加了模拟电脉冲。当我们观察时,神经元开始相互交谈。“尖峰”,或动作电位——大脑的语言——在柱中传播,因为它开始像一个集成电路一样工作。尖峰在层之间流动并来回振荡,就像在活体脑切片中一样。这是我们没有编入模型的行为;它是由于电路的构建方式而自发出现的。即使刺激停止后,电路仍然保持活跃,并短暂地发展出自己的内部动态,自己表示信息的方式。

从那时起,我们一直在逐步将世界各地实验室产生的更多信息整合到这个柱的统一模型中。我们开发的软件也在不断改进,以便我们每周重建柱时,都能使用更多数据、更多规则和更高的准确性进行重建。下一步是整合整个大脑区域的数据,然后是整个大脑的数据——首先是啮齿动物的大脑。

我们的努力将很大程度上依赖于一门称为神经信息学的学科。来自世界各地的大量与大脑相关的数据需要以连贯的方式汇集在一起,然后挖掘描述大脑组织方式的模式或规则。我们需要以数学方程组的形式捕捉这些规则描述的生物过程,同时开发软件,使我们能够在超级计算机上求解这些方程。我们还需要创建软件,构建一个符合内在生物学规律的大脑。我们称之为“大脑构建器”。

神经信息学提供的大脑运作方式的预测——以及新数据完善的预测——将加速我们对大脑功能的理解,而无需测量它的每一个方面。我们可以根据我们正在发现的规则做出预测,然后根据现实检验这些预测。我们目前的目标之一是利用赋予某些类型神经元蛋白质的基因知识来预测这些细胞的结构和行为。基因与实际神经元之间的联系构成了我们称之为“信息学桥梁”的东西,这是综合生物学为我们提供的捷径。

科学家们多年来一直利用的另一种信息学桥梁与基因突变及其与疾病的联系有关:具体而言,突变如何改变细胞制造的蛋白质,进而影响神经元的几何形状和电特性、它们形成的突触以及局部、微回路中出现的电活动,然后在整个大脑区域广泛传播。

例如,理论上,我们可以将某个突变编程到模型中,然后观察该突变如何在生物链的每一步影响它。如果由此产生的症状或症状群与我们在现实生活中看到的相符,那么这种虚拟事件链就成为疾病机制的候选者,我们甚至可以开始寻找潜在的治疗靶点。

这个过程是高度迭代的。我们整合我们能找到的所有数据,并对模型进行编程以遵守某些生物学规则,然后运行模拟,并将“输出”或蛋白质、细胞和电路的最终行为与相关的实验数据进行比较。如果它们不匹配,我们会返回并检查数据的准确性并完善生物学规则。如果它们匹配,我们会引入更多数据,添加更多细节,同时将我们的模型扩展到大脑的更大一部分。随着软件的改进,数据集成变得更快和自动化,模型表现得更像实际的生物学。当我们对细胞和突触的知识仍然不完整时,模拟整个大脑似乎不再是一个不可能的梦想。

为了推动这项事业,我们需要数据,而且需要大量数据。伦理问题限制了神经科学家可以对人脑进行的实验,但幸运的是,所有哺乳动物的大脑都是按照共同的规则构建的,只是存在物种特异性的变异。我们对哺乳动物大脑遗传学的大部分了解来自小鼠,而猴子为我们提供了关于认知的宝贵见解。因此,我们可以首先构建一个啮齿动物大脑的统一模型,然后将其用作开发我们的人脑模型的起始模板——逐步整合细节。因此,小鼠、大鼠和人脑的模型将并行发展。

神经科学家生成的数据将帮助我们识别控制大脑组织的规则,并通过实验验证我们的外推——那些预测的因果链——是否与生物学真相相符。在认知层面,我们知道非常小的婴儿对数字概念 1、2 和 3 有一些掌握,但对更高的数字没有掌握。当我们最终能够模拟新生儿的大脑时,该模型必须概括婴儿能做什么和不能做什么。

我们需要的许多数据已经存在,但它们不易获取。HBP 的一个主要挑战是将它们汇集和组织起来。以医疗领域为例:这些数据对我们来说将非常有价值,不仅因为功能障碍告诉我们正常功能,还因为我们产生的任何模型都必须像健康的大脑一样运作,然后在生病的方式上与真实的大脑相同。因此,患者的脑部扫描将成为丰富的信息来源。

目前,每次患者进行扫描时,该扫描都存储在数字档案中。世界各地的医院储存着数百万份扫描件,尽管它们已经被用于研究目的,但研究是以如此零散的方式进行的,以至于它们仍然是一个很大程度上未开发的资源。如果我们能够将这些扫描件汇集到互联网可访问的“云”上,并将它们与患者的记录以及生化和遗传信息一起收集起来,医生就可以跨越大量患者人群寻找定义疾病的模式。这种策略的力量将来自于能够用数学方法精确找出所有疾病之间的差异和相似之处。一个名为阿尔茨海默病神经影像学倡议的多大学合作项目正试图通过收集大量痴呆症患者和健康对照组受试者的神经影像学、脑脊液和血液记录来做到这一点。

计算的未来
最后但并非最不重要的一点是,计算问题。最新一代的蓝色基因是一种百亿亿次级野兽,由近 30 万个处理器组成, packed 在 72 个冰箱的空间内。百亿亿次级足以在细胞细节水平上模拟一个拥有 2 亿神经元的大鼠大脑,但不足以模拟一个拥有 890 亿神经元的人脑。为了实现这一目标,我们需要一台百京级超级计算机,即使如此,分子水平的人脑模拟也将超出我们的能力范围。

世界各地的团队都在竞相构建这样的计算机。当它们问世时,就像前几代超级计算机一样,它们很可能被调整为模拟物理过程,例如核物理中使用的过程。生物模拟有不同的要求,在与大型计算机制造商和其他工业合作伙伴的合作中,我们的高性能计算专家联盟将配置一台这样的机器,用于模拟大脑的任务。他们还将开发软件,使我们能够构建从最低分辨率到最高分辨率的统一模型,以便在我们的模拟器中,可以放大和缩小分子、细胞和整个大脑。

一旦我们的脑模拟器建成,研究人员将能够使用软件样本设置计算机内实验,就像他们使用生物样本一样,但有一些关键的区别。为了让您了解这些可能是什么,请考虑科学家目前如何通过使用基因被“敲除”的小鼠来寻找疾病的根源。他们必须繁殖小鼠,这既耗时又昂贵,而且并非总是可行——例如,如果敲除对胚胎是致命的——即使人们撇开围绕动物实验的伦理问题不谈。

使用计算机内大脑,他们将能够敲除一个虚拟基因,并在不同年龄和以独特方式运作的“人类”大脑中看到结果。他们将能够在尽可能多的不同条件下重复实验,使用相同的模型,从而确保动物无法获得的彻底性。这不仅可以加快制药研究人员确定潜在药物靶点的过程,还将改变临床试验的进行方式。选择目标人群将容易得多,并且无效或具有不可接受的副作用的药物将被更快地过滤掉,结果是整个研发管道将得到加速并提高效率。

我们从这些模拟中学到的东西也将反馈到计算机的设计中,揭示进化是如何产生一个具有弹性的、能够大规模快速、同步地执行多项任务——同时消耗与灯泡相同的能量——并且具有巨大记忆容量的大脑的。

类脑计算机芯片将用于构建所谓的神经形态计算机。HBP 将在硅芯片上印刷大脑电路,建立在欧盟项目 BrainScaleS 和 SpiNNaker 开发的技术基础上。

我们在仪器上运行的第一个全脑模拟将缺乏人脑的一个基本特征:它们不会像儿童那样发育。从出生开始,皮层就形成了,这是神经元的增殖、迁移和修剪以及我们称之为可塑性的过程的结果,可塑性高度依赖于经验。相反,我们的模型将从任何任意年龄开始,跳过多年的发展,并从那里继续捕捉经验。我们将需要构建机器,使模型能够响应来自环境的输入而发生变化。

虚拟大脑的试金石将是当我们将其连接到身体的虚拟软件表示并在逼真的虚拟环境中放置它时。然后,计算机内大脑将能够接收来自环境的信息并对其采取行动。只有在取得这一成就之后,我们才能教会它技能,并判断它是否真正具有智能。因为我们知道人脑中存在冗余——也就是说,一个神经系统可以补偿另一个神经系统——我们可以开始找到哪些方面的大脑功能对于智能行为至关重要。

HBP 提出了重要的伦理问题。即使模拟人脑的工具还很遥远,询问构建一个拥有比人脑更多皮质柱或将类人智能与数字运算能力结合起来的虚拟大脑是否负责任也是合理的,该数字运算能力比 IBM 的深蓝(其国际象棋计算机)大一百万倍。

我们不是唯一一个在试图扭转大脑研究碎片化局面方面设定高标准的人。2010 年 5 月,总部位于西雅图的艾伦脑科学研究所启动了艾伦人脑图谱,目标是绘制人脑中所有活跃基因的图谱。

资金很可能是任何试图进行此类尝试的团体的主要限制因素。就我们而言,只有在我们获得所需支持的情况下,目标才能实现。超级计算机很昂贵,HBP 的最终成本很可能与人类基因组计划的成本相当或超过。在 2013 年 2 月,我们将知道我们是否获得了绿灯。与此同时,我们继续推进我们相信将为我们提供对自身身份的无与伦比的洞察力的事业,作为能够思考卡拉瓦乔绘画的明暗对比或量子物理学悖论的生物。

本文以“人类大脑计划”为标题在印刷版上发表。

© . All rights reserved.