夸贝纳·博阿亨在1982年获得了他的第一台电脑,当时他还是个住在阿克拉的青少年。“那真是一个很酷的设备,”他回忆道。他只需要连接一个盒式播放器用于存储,一台电视机用于显示器,就可以开始编写程序了。
但当博阿亨发现他的电脑内部是如何工作的时候,他并没有那么印象深刻。“我了解到中央处理器不断地来回传输数据。我当时想,‘天哪!它真的要像疯了一样工作!’”他本能地感觉到,计算机的设计需要更多“非洲”元素,“更分散、更流畅、更少僵化”。
今天,作为加利福尼亚州斯坦福大学的生物工程师,博阿亨是少数试图通过逆向工程大脑来创造这种计算方式的研究人员之一。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道: 订阅。通过购买订阅,您正在帮助确保未来能够继续讲述关于塑造我们当今世界的发现和想法的具有影响力的故事。
大脑非常节能,并且可以执行挑战世界最大型超级计算机的计算,即使它依赖于明显不完美的组件:神经元是缓慢、可变、有机的混乱集合。理解语言、进行抽象推理、控制运动——大脑完成所有这些以及更多的事情,而其体积比鞋盒还小,功耗比家用灯泡还低,并且不包含任何类似于中央处理器的东西。
为了在硅芯片中实现类似的壮举,研究人员正在构建非数字芯片系统,使其尽可能像真实神经元网络一样工作。就在几年前,博阿亨完成了一个名为 Neurogrid 的设备,它可以模拟一百万个神经元——大约相当于蜜蜂大脑中的神经元数量。现在,经过四分之一世纪的开发,“神经形态技术”的应用终于在望。该技术有望应用于任何需要体积小、功耗低的应用,从智能手机和机器人到人工眼睛和耳朵。这一前景吸引了许多研究人员在过去五年中进入该领域,并获得了来自美国和欧洲机构的数亿美元研究资金。
苏黎世神经信息学研究所 (INI) 的 Giacomo Indiveri 表示,神经形态设备也为神经科学家提供了强大的研究工具。他说,通过观察神经功能模型在真实物理系统中是否按预期工作,“你可以深入了解大脑为何以这种方式构建”。
博阿亨说,神经形态方法应该有助于规避摩尔定律——计算机芯片制造商设法每两年左右将给定空间内可容纳的晶体管数量增加一倍的长期趋势——即将到来的限制。这种无情的缩小很快将导致硅电路变得如此微小和紧密,以至于它们不再产生干净的信号:电子将泄漏通过组件,使它们像神经元一样混乱。一些研究人员正致力于通过软件修复来解决这个问题,例如,通过使用类似于帮助互联网平稳运行的统计纠错技术。但博阿亨认为,最终最有效的解决方案与大脑数百万年前得出的解决方案相同。
“我的目标是一种新的计算范式,”博阿亨说,“即使组件太小而无法可靠,它也能进行计算。”
硅细胞
神经形态的想法可以追溯到 20 世纪 80 年代和卡弗·米德:加州理工学院帕萨迪纳分校一位世界知名的微芯片设计先驱。他创造了这个术语,并且是最早强调大脑巨大节能优势的人之一。“这对我来说一直很着迷,”他说,“大脑到底是如何做到它所做的事情的?”
米德回答这个问题策略是用“亚阈值”硅来模仿大脑的低功耗处理:电路在电压太小而无法将标准计算机位从 0 翻转到 1 的情况下运行。在这些电压下,仍然有微小的、不规则的电子涓流流过晶体管——电流的自发涨落,其大小和可变性与离子流过神经元通道所携带的电流非常相似。米德认为,通过添加微小的电容器、电阻器和其他组件来控制这些电流,应该有可能制造出表现出与真实神经元相同电学行为的微小电路。它们可以连接到分散的网络中,这些网络的功能很像大脑中的真实神经回路,通信线路在组件之间运行,而不是通过中央处理器。
到 20 世纪 90 年代,米德和他的同事已经证明,构建逼真的硅神经元是可能的(参见“生物学灵感”)。该设备可以通过执行突触作用的连接点接受外部电输入,突触是神经冲动从一个神经元跳到下一个神经元的微小结构。它允许传入信号在电路内部积累电压,就像它们在真实神经元中所做的那样。如果积累的电压超过某个阈值,硅神经元就会“放电”,产生一系列电压尖峰,这些尖峰沿着一根导线传播,扮演着轴突的角色,即神经元的通信电缆。虽然这些尖峰在某种意义上是“数字的”,因为它们要么是“开”要么是“关”,但硅神经元的主体——像真实神经元一样——以非数字方式运行,这意味着电压和电流不像传统芯片那样被限制在少数离散值。
这种行为模仿了大脑低功耗使用的一个关键:就像它们的生物对应物一样,硅神经元只是简单地整合输入,使用非常少的能量,直到它们放电。相比之下,传统计算机需要持续的能量流来运行内部时钟,无论芯片是否在进行任何计算。
米德的小组还展示了分散的神经回路——最著名的是硅版本的眼睛视网膜。该设备使用 50x50 的探测器网格捕捉光线。当它们的活动显示在计算机屏幕上时,这些硅细胞显示出与真实对应物对光、阴影和运动大致相同的反应。与大脑一样,该设备通过仅发送重要数据来节省能量:视网膜中的大多数细胞在光照水平发生变化之前不会放电。这具有突出移动物体边缘的效果,同时最大限度地减少了必须传输和处理的数据量。
编码挑战
博阿亨在 1990 年加入了米德的实验室,他说,在早期,研究人员忙于掌握诸如硅视网膜等单芯片设备。但他说,到 20 世纪 90 年代末,“我们想构建一个大脑,为此我们需要大规模通信”。这是一个巨大的挑战:芯片到芯片通信的标准编码算法是为精确协调的数字信号设计的,并且不适用于神经形态系统产生的更随机的尖峰。直到 21 世纪 00 年代,博阿亨和其他人设计了可以在这种更混乱的系统中工作的电路和算法,为大规模神经形态系统的蓬勃发展开辟了道路。
最早的应用之一是大型模拟器,为神经科学家提供了一种测试大脑功能模型的简便方法。例如,在 2006 年 9 月,博阿亨启动了 Neurogrid 项目:一项模拟一百万个神经元的努力。这只是人类大脑中 860 亿个神经元中的一小部分,但足以模拟几个被认为构成人类皮层计算单元的密集互连的神经元柱。博阿亨说,神经科学家可以对 Neurogrid 进行编程,以模拟几乎任何皮层模型。然后,他们可以观察他们的模型以与大脑相同的速度运行——比传统的数字模拟快数百到数千倍。研究生和研究人员已经使用它来测试工作记忆、决策和视觉注意力等过程的神经功能理论模型。
INI 联合创始人兼硅神经元共同开发者罗德尼·道格拉斯说:“就真正的效率而言,就对大脑神经元网络的忠实度而言,夸贝纳的 Neurogrid 远远领先于其他大型神经形态系统。”
但是,正如博阿亨自己很快指出的那样,没有哪个系统是完美的。Neurogrid 最大的缺点之一是它的突触——每个神经元平均有 5,000 个突触——是简化的连接,无法单独修改。这意味着该系统不能用于模拟学习,学习发生在大脑中,当突触被经验修改时。考虑到芯片上可用的有限空间,挤入使每个突触以更逼真的方式表现所需的复杂电路,将需要比目前面积小约一千倍的电路元件——在纳米技术的领域。这目前是不可能的,尽管一种新开发的称为“忆阻器”的纳米级存储器件有一天可能会解决这个问题。
另一个问题源于制造过程中不可避免的变化,这意味着每个神经形态芯片的性能略有不同。“这种可变性仍然远小于在大脑中观察到的可变性,”博阿亨说——但这确实意味着 Neurogrid 的程序必须允许硅神经元的放电率存在显着变化。
这个问题导致一些研究人员放弃了米德最初使用亚阈值芯片的想法。相反,他们正在使用更传统的数字系统,这些系统在模仿单个神经元的电学行为的意义上仍然是神经形态的,但更可预测且更容易编程——但代价是使用更多功率。
一个主要的例子是 SpiNNaker 项目,该项目自 2005 年以来由英国曼彻斯特大学的计算机工程师史蒂夫·弗伯领导。该系统使用了一种超低功耗数字芯片版本——弗伯帮助开发了这种芯片——这种芯片在许多智能手机中都可以找到。SpiNNaker 目前可以模拟多达 500 万个神经元。弗伯说,这些神经元比 Neurogrid 中的神经元更简单,并且消耗更多功率,但该系统的目的是相似的:“在生物学实时中运行大型大脑模型”。
另一项努力坚持使用类似神经元的芯片,但提高了它们的速度。Neurogrid 的神经元以与真实神经元完全相同的速率运行。但是由德国海德堡大学前加速器物理学家卡尔海因茨·迈尔领导的欧洲 BrainScaleS 项目正在开发一种神经形态系统,该系统目前可以模拟 40 万个神经元,其运行速度比实时快 10,000 倍。这意味着它消耗的能量大约是大脑中等效过程的 10,000 倍。但这种速度对一些神经科学研究人员来说是一个福音。“我们可以在 10 秒内模拟一天的神经活动,”迈尔说。
弗伯和迈尔现在有资金推动更大更好的发展。他们共同构成了欧盟为期十年、耗资 10 亿欧元(13 亿美元)的人脑项目的神经形态部门,该项目已于上个月正式启动。大约 1 亿欧元用于神经形态研究,这将使弗伯的小组能够将他的系统扩展到 5 亿个数字神经元;与此同时,迈尔的小组的目标是 400 万个。
这些以研究为导向的项目的成功帮助激发了人们对在从手机到机器人的设备中使用神经形态硬件进行实用、超低功耗应用的想法的兴趣。直到最近,这还不是计算机行业的优先事项。芯片设计师通常可以通过简化电路设计,或将计算分散到多个可以并行运行或在不需要时关闭的处理器“内核”上来最大限度地降低功耗。
但这些方法只能取得这么多成就。自 2008 年以来,美国国防高级研究计划局已在其 SyNAPSE 项目上花费了超过 1 亿美元,以开发紧凑、低功耗的神经形态技术。该项目的主要承包商之一,IBM 在加利福尼亚州阿尔马登研究中心的认知计算小组,已利用其获得的资金开发了数字化的 256 神经元芯片,可用作更大规模系统的构建块。
大脑力量
博阿亨正在追求他自己的实用应用方法——最值得注意的是他在四月份启动的一项尚未命名的倡议。该项目基于 Spaun:一种大脑计算机模型的设计,其中包括负责视觉、运动和决策的部分。Spaun 依赖于十年前由加拿大安大略省滑铁卢大学的理论神经科学家克里斯·埃利亚史密斯开发的神经电路编程语言。用户只需指定所需的神经功能——例如,生成移动手臂的指令——埃利亚史密斯的系统将自动设计一个脉冲神经元网络来执行该功能。
为了看看它是否有效,埃利亚史密斯和他的同事在传统计算机上模拟了 Spaun。他们表明,通过 250 万个模拟神经元加上模拟视网膜和手,它可以复制手写数字、回忆列表中的项目、计算给定序列中的下一个数字以及执行其他几项认知任务。博阿亨说,这在神经模拟标准下是前所未有的能力范围。但 Spaun 模拟的运行速度比实时慢约 9,000 倍,模拟 1 秒的行为需要 2.5 小时。
博阿亨联系了埃利亚史密斯,提出了一个显而易见的建议:使用实时神经形态硬件构建 Spaun 的物理版本。“我非常兴奋,”埃利亚史密斯说,对他来说,这种匹配似乎是完美的。“你有花生酱,我们有巧克力!”
在美国海军研究办公室的资助下,博阿亨和埃利亚史密斯组建了一个团队,计划在三年内构建一个小规模原型,并在五年内构建一个全尺寸系统。博阿亨说,对于感官输入,他们将使用在 INI 开发的神经形态视网膜和耳蜗。对于输出,他们有一个机械臂。但认知硬件将从头开始构建。“这不是一个新的 Neurogrid,而是一个全新的架构,”他说。它将牺牲一定的真实性来换取实用性,依靠“非常简单、非常高效的神经元,以便我们可以扩展到数百万”。
该系统是专门为实际应用而设计的。博阿亨说,在五年时间内,“我们设想构建完全自主的机器人,这些机器人可以以有意义的方式与其环境互动,并在实时操作,同时[它们的大脑]消耗的电力与手机一样多”。与今天的自主机器人相比,此类设备将更加灵活和适应性更强,并且功耗将大大降低。
博阿亨补充说,从长远来看,该项目可以为任何计算机系统(而不仅仅是机器人技术)中的紧凑型、低功耗处理器铺平道路。如果研究人员真的成功捕捉到了使大脑如此高效、紧凑和强大的基本要素,那么它可能是即将撞墙的行业的救星,因为芯片变得越来越小。
“但在我们尝试之前,我们不会确定的,”博阿亨说。
本文经《自然》杂志许可转载。该文章于 2013 年 11 月 6 日首次发表。