在世界领先的微处理器和半导体制造商英特尔的研发总部一间狭小、无窗的会议室里,该公司工艺架构和集成总监马克·玻尔冷静地解释说,通常理解的摩尔定律已经失效——而且已经有一段时间了。考虑到玻尔实际上从事的是摩尔定律相关业务,这似乎令人惊讶:他的工作是弄清楚如何在十年内将英特尔目前 14 纳米宽的晶体管缩小一半。但在他圆框眼镜后面,玻尔甚至眼睛都没眨一下:“你必须明白,传统的晶体管缩放时代,即采用相同的基本结构和材料并使其更小的时代,大约在 10 年前就结束了。”
1965 年,时任仙童半导体研发主管的戈登·摩尔发表了一份题为《将更多组件塞进集成电路》的直率文件。摩尔预测,以最佳成本构建到芯片中的晶体管数量将每年翻一番。十年后,他将他的预测修改为后来被称为摩尔定律的内容:计算机芯片上的晶体管数量每两年将翻一番。
集成电路使计算机工作。但摩尔定律使计算机进化。由于晶体管是电子计算的“原子”——将计算机内存和逻辑的每个 1 和 0 编码为电压差异的微小开关——如果你将可以放入相同物理空间的晶体管数量增加一倍,你就可以以相同的成本将计算量增加一倍。英特尔的第一款通用微处理器 8080 于 1974 年发布,帮助启动了 PC 革命。这款两英寸长、糖棒形状的晶圆包含 4,500 个晶体管。截至本文撰写之时,英特尔的高性能服务器中央处理器 (CPU)——市场上密度最高的芯片——每个包含 45 亿个晶体管。在英特尔位于俄勒冈州希尔斯伯勒的制造工厂(或称“晶圆厂”)内,该公司最新的制造工艺可以在硅晶圆上蚀刻小至 14 纳米的特征。这比细菌的鞭毛还要薄。晶体管密度的这种指数级增长将 20 世纪中叶房间大小、真空管供电的计算引擎变成了 21 世纪初微型化的硅奇迹。
支持科学新闻报道
如果您喜欢这篇文章,请考虑通过以下方式支持我们屡获殊荣的新闻报道 订阅。通过购买订阅,您正在帮助确保有关塑造我们今天世界的发现和想法的具有影响力的故事的未来。
但即使是摩尔定律,在物理定律面前也会屈服——并且在十年内,将不再可能维持这种前所未有的微型化步伐。这就是为什么英特尔、IBM 和惠普 (HP) 等芯片制造商正在投入数十亿美元的研发资金,以寻找后摩尔定律时代的出路。这将需要颠覆关于我们的技术运行所需的基本假设。计算机芯片是否需要是蚀刻在硅上的二维导线阵列?IBM 认为不是:它正在认真研究碳纳米管和石墨烯作为计算基板。那么电子呢——这些是必要的吗?IBM 和 HP 也在光子学上下注,光子学使用光脉冲而不是电压。
惠普走得更远;它希望扩展电子学本身的基本理论。该公司构建了一台原型计算机,代号为“机器”,它利用了长期寻求的电子学缺失环节的力量:忆阻器。这种组件——在数学上几十年前就已预测到,但直到最近才开发出来——允许计算机的存储和随机存取存储器 (RAM) 功能结合在一起。CPU 作为计算机“大脑”的常用比喻,在使用忆阻器代替晶体管后将变得更加准确,因为前者实际上更像神经元那样工作:它们传输和编码信息以及存储信息。以这种方式结合易失性存储器和非易失性存储,可以显着提高效率并减少所谓的冯·诺依曼瓶颈,后者已经限制了计算机技术半个世纪。
在未来几年内,这些技术都无法取代甚至增强我们笔记本电脑或手机中的芯片。但在十年末之前,其中至少有一项技术必须能够提供计算性能提升,并且有希望接替传统硅电路工程不可避免地衰落的地方。问题是:哪一项——以及何时?
超越硅
摩尔定律背后的理念很简单——将晶体管数量增加一倍意味着你可以以相同的成本提高计算性能。但一直以来,其中包含的远不止这些。戈登·摩尔 1965 年的论文可能预测了什么会每隔一年发生在晶体管密度上,但他从未描述如何这种增加的性能将从增加的密度中涌现出来。*
又过了九年,IBM 的一位名叫罗伯特·登纳德的科学家发表了一篇解释,现在称为登纳德缩放定律。它描述了 MOSFET(代表“金属氧化物半导体场效应晶体管”,1974 年的主导技术)的功率密度如何随着其物理尺寸的缩小而保持恒定。换句话说,随着晶体管的缩小,打开和关闭它们所需的电压和电流也会缩小。
30 年来,登纳德缩放定律一直是摩尔定律的秘密驱动力,它保证了稳定的 PC 性能提升,帮助人们创业、设计产品、治疗疾病、引导航天器和普及互联网。然后它停止工作了。一旦晶圆厂开始在硅上蚀刻小于 65 纳米(大约是 HIV 病毒长度的一半)的特征,芯片设计师发现他们的晶体管开始因量子力学效应而“泄漏”电子。这些器件变得太小,无法可靠地在“开”和“关”之间切换——任何无法区分 1 和 0 的数字计算机都会遇到严重问题。不仅如此,IBM 和英特尔的研究人员还发现了一堵所谓的频率墙,它限制了基于硅的 CPU 可以执行逻辑运算的速度——大约每秒 40 亿次——而不会因过热而熔毁。
从技术上讲,摩尔定律可以继续(并且确实如此):英特尔继续每两年将其晶圆中塞入更小的晶体管。然而,它并没有完全转化为更便宜、更快的计算机。
自 2000 年以来,面对这些障碍的芯片工程师一直在开发巧妙的变通方法。他们通过引入多核 CPU 来避开频率墙(一个 10 吉赫兹的处理器会烧坏自己,但四个、八个或 16 个 3 吉赫兹的处理器协同工作则不会)。他们用“三栅极”加固了泄漏的晶体管,三栅极从三侧而不是一侧控制电流的流动。他们还构建了让 CPU 将特别费力的任务外包给专用助手(例如,iPhone 6 的屏幕由其自己的四核图形处理器驱动)的系统。但这些权宜之计不会改变硅缩放定律只剩下不到十年寿命的事实。
这就是为什么一些芯片制造商正在寻找摆脱硅的方法。去年,IBM 宣布将拨款 30 亿美元,积极研究各种形式的后硅计算。正在研究的主要材料是石墨烯:只有一层原子厚的碳片。与硅一样,石墨烯具有在很宽温度范围内保持稳定的电子学上有用的特性。更棒的是,电子以相对论速度在其中穿梭。最关键的是,它可以缩放——至少在实验室中是这样。已经构建了石墨烯晶体管,其运行速度可以比性能最佳的硅器件快数百甚至数千倍,并且功率密度合理,甚至低于硅进入量子状态的 5 纳米阈值。
然而,与硅不同,石墨烯缺乏“带隙”:电子束缚在原子中的轨道和电子可以自由移动并参与传导的轨道之间的能量差。例如,金属没有带隙:它们是纯导体。没有带隙,就很难阻止将晶体管从开到关的电流流动——这意味着石墨烯器件无法可靠地编码数字逻辑。“我们一直是该领域的领导者,但我们在石墨烯方面看到的结果并不令人鼓舞,”IBM 托马斯·J·沃森研究中心物理科学主管苏普拉蒂克·古哈承认。“石墨烯必须非常便宜并且提供一些独特的优势才能取代现有材料。它具有非常有趣的特性,但它没有我们能够确定的杀手锏应用。”
碳纳米管可能更有希望。当石墨烯片卷成空心圆柱体时,它们可以获得一个小的带隙,使其具有类似于硅的半导体特性,从而重新开启了将它们用于数字晶体管的可能性。“我们持谨慎乐观态度,”古哈说。“作为单独器件的碳纳米管,当它们缩小到 10 纳米左右时,其性能优于任何其他可用器件。如果我们查看我们使用碳纳米管的计算系统模拟,我们预计性能或能源效率可能会提高五倍[超过硅]。”
但碳纳米管是脆弱的结构。如果纳米管的直径或手性——其碳原子“卷曲”的角度——即使发生微小变化,其带隙也可能消失,使其无法用作数字电路元件。工程师还必须能够使用硅晶圆厂现在依赖的相同技术,将数十亿个纳米管整齐地排列成行,行距仅为几纳米。“为了让碳纳米管成为硅的有价值的继任者,我们需要在未来两三年内弄清楚这一切,”古哈说。
打破内存墙
“地球上最昂贵的房地产是什么?”安德鲁·惠勒问道。“就是这个,就在这里。”他指着白板上用黑色记号笔绘制的一个方框,代表微芯片的芯片。惠勒身材高挑、身材瘦削、下巴方正,穿着直筒牛仔裤和格子棉衬衫,看起来更像是一位前牛仔,而不是惠普实验室(惠普的研究部门)的副主任。他正在解释占用这片优质房地产的大部分晶体管实际上用于什么。他说,它不是用于计算。它被称为“高速缓存存储器”或静态 RAM (SRAM),它所做的只是存储频繁访问的指令。它是你 Mac 上 Dock 的硅等价物——你想要避免挖掘的东西的存放地。惠勒希望它消失。但他有点超前了。在短期内,他将满足于摆脱你计算机的硬盘驱动器和主内存。
根据惠普的说法,这三项——统称为内存层次结构,SRAM 位于顶部,硬盘驱动器位于底部——是工程师们在应对摩尔定律时面临的大部分问题的原因。如果没有高速、大容量的内存来存储位并尽可能快地传输它们,更快的 CPU 就没什么用处。
为了打破这个“内存墙”,惠勒在加利福尼亚州帕洛阿尔托的团队一直在设计一种新型计算机——机器——它通过将内存层次结构折叠成一个统一层来完全避免内存层次结构。内存层次结构中的每一层都擅长某些事情,而不擅长其他事情。SRAM 速度极快(因此它可以跟上 CPU),但功耗大且容量低。主内存或动态 RAM (DRAM) 非常快、密度高且耐用——这很好,因为这是你的计算机用于运行活动应用程序的工作台。当然,断电会使 DRAM 中的所有内容消失,这就是为什么“非易失性”存储介质(如闪存和硬盘)对于长期存储数据是必要的。它们提供高容量和低功耗,但它们速度非常慢(并且闪存磨损相对较快)。由于每种内存介质都有重叠的权衡,现代计算机将它们链接在一起,以便 CPU 可以尽可能高效地在层级之间传输数据。“这绝对是工程奇迹,”惠勒说。“但这也是巨大的浪费。”
惠勒说,一种可以结合 SRAM 的速度、DRAM 的耐用性以及闪存存储的容量和功率效率的通用内存一直是工程师、设计师和程序员几十年来梦寐以求的圣杯。机器利用电子元件忆阻器来涵盖通用内存愿望清单上的后两项。忆阻器在 1971 年以数学方式预测出来——它是“memory resistor”(记忆电阻器)这两个词的混合体,因为该器件的导电能力取决于先前流过它的电流量——长期以来一直被认为是不可能构建的。2008 年,惠普宣布它已经构建了一个工作忆阻器;该研究计划在内部被快速跟踪,并成为机器的前身。
用电压脉冲忆阻器存储单元可以改变其导电状态,从而产生存储数字数据所需的清晰的开/关区分。与闪存一样,当电流移除时,该状态仍然存在。并且像 DRAM 一样,可以在高速读写单元,同时将它们密集地封装在一起。
但是,为了实现类似 SRAM 的性能,忆阻器单元需要放置在与 CPU 相邻的同一硅芯片上——在当前技术下,这在物理上是不切实际的安排。相反,惠普计划采用光子学——将位作为激光脉冲而不是电流传输——将其高性能忆阻器内存连接到逻辑处理器上的标准 SRAM 缓存。它还不是通用内存的圣杯——机器将内存层次结构从三层折叠为两层——但它已经很接近了。
通过将 RAM 与非易失性存储相结合,像机器这样的基于忆阻器的架构可以在不依赖摩尔定律式微型化的情况下实现计算机性能的大幅提升。IBM 的沃森超级计算机在 2011 年的《危险边缘》节目中击败人类选手,它需要 16 TB 的 DRAM—— housed in 10 power-guzzling Linux server racks——才能实时执行其壮举。相同数量的非易失性闪存可以装在一个鞋盒中,同时消耗与普通笔记本电脑相同的电量。一次性结合这两个功能的内存架构将允许将海量数据集保存在活动内存中进行实时处理,而不是切成更小的、顺序的块——并且能源成本要低得多。
随着越来越多的连接设备加入“物联网”,将无数拍字节的信息流式传输到数据中心并从数据中心流式传输以进行存储和处理的问题将使摩尔定律变得毫无意义,惠勒说。然而,如果通用内存使超级计算机般的功能能够在更小、更节能的封装中实现,那么这些数据流可以在本地由连接的设备本身存储和预处理。硅 CPU 元件可能永远不会小于 7 纳米或快于 4 吉赫兹——但随着内存墙被打破,这可能不再重要。
超越冯·诺依曼
即使惠普成功地构建了通用内存,计算机仍然会像自 1946 年建造的第一台通用计算机 ENIAC 以来一直存在的那样:极其快速的数值计算器。它们的基本设计由数学家约翰·冯·诺依曼于 1945 年正式确定,包括一个执行指令的处理单元、一个存储这些指令和它们要操作的数据的内存库,以及一个连接它们的连接或“总线”。这种冯·诺依曼架构针对以线性序列执行符号指令进行了优化——也称为进行算术运算。第一批“计算机”是人类,他们受雇坐在房间里手工计算,因此电子计算机被设计为自动化这种繁琐且容易出错的过程并非巧合。
但是今天,我们越来越需要计算机来完成不适合线性数学指令的工作:例如在数小时的视频片段中识别感兴趣的对象或引导自主机器人在不稳定或危险的区域中穿行。这些任务与生物大脑的感知、模式匹配能力比机械计算器更相似。生物体必须实时地从动态环境中提取可操作的信息;如果一只家蝇被迫在它大脑中独立的内存和处理器模块之间来回传递离散指令,一次一个,那么它永远无法及时完成计算以避免被拍死。
IBM 认知计算小组的创始人达尔门德拉·莫德哈希望构建至少与家蝇一样“聪明”且节能的计算机芯片。他解释说,关键在于放弃类似计算器的冯·诺依曼架构。相反,他的团队的目标是模仿哺乳动物大脑中的皮质柱,后者在同一结构中处理、传输和存储信息,没有总线瓶颈连接。IBM 最近推出的 TrueNorth 芯片包含超过 50 亿个晶体管,排列成 4,096 个神经突触核心,模拟 100 万个神经元和 2.56 亿个突触连接。
这种安排带来的好处是以激光笔的能源预算实现实时模式匹配性能。莫德哈指着位于加利福尼亚州圣何塞 IBM 阿尔马登研究园区演示室角落的一台视频监视器。上面的场景看起来像是来自一台需要硬重启的摄像头的监控录像:汽车、行人和一两辆自行车在环形交叉路口冻结在原地;其中一位行人被图像上叠加的红色方框突出显示。一分钟后,汽车、人和自行车猛地跳到另一个冻结位置,就好像录像突然跳过一样。
“你看,这不是静止图像,”莫德哈解释说。“那是斯坦福大学校园的视频流,由一台模拟 TrueNorth 芯片的笔记本电脑进行分析。它只是以大约比实时慢 1,000 倍的速度运行。”通常运行视频流的实际 TrueNorth 芯片正在隔壁礼堂用于内部培训课程,所以我没有亲眼目睹该芯片的真实性能。莫德哈说,如果我看到了,视频源将以实时速度播放,并且小红框将平稳地跟踪行人进出画面。
就像它们的冯·诺依曼架构对应物一样,诸如 TrueNorth 之类的神经突触器件也有其固有的弱点。“你不会想用这个芯片运行 iOS,”莫德哈说。“我的意思是,你可以,但它会非常低效——就像笔记本电脑在处理该视频流时效率低下一样。”IBM 的目标是将两种架构的效率结合起来——一种用于精确和逻辑计算,另一种用于响应迅速、关联的模式匹配——融入它所描述的整体计算系统。
在这种愿景中,经典公式的摩尔定律仍然很重要。莫德哈的团队已经将 16 个 TrueNorth 芯片平铺到一块板上,到今年年底,该小组计划将八块板堆叠在一起,形成一个 100 瓦、烤面包机大小的设备,其计算能力“将需要整个数据中心来模拟”。
换句话说,硅和晶体管数量仍然很重要——但更重要的是它们的排列方式。“那是我们的洞察力:通过重新排列砖块,你会在建筑物中获得非常不同的功能,”莫德哈说。“很多人都认为,包括我们一开始也这样认为,你真的需要改变技术才能获得收益。事实上,很明显,虽然新技术可能会带来收益,但新的架构在性能方面带来了数量级的收益,相比之下,这很容易获得。”
摩尔定律
回到希尔斯伯勒的 RA3 大楼,英特尔组件研究主管迈克尔·C·梅伯里正在消除关于摩尔定律的另一个神话:它从来都不是真正关于晶体管的。“每项功能的成本才是关键,”他说。无论是用每平方厘米硅的晶体管数量、每秒执行的代码指令数还是每瓦功率的性能来衡量,重要的都是用更少的资源完成更多的工作。毫不奇怪,英特尔在其自己的网站上将摩尔定律描述为一种商业模式,而不是一种技术趋势或自然力量。
“当有人问我,‘关于摩尔定律,有什么让你夜不能寐?’时,我说,‘我睡得很好,’”梅伯里说。“当登纳德缩放定律结束时,这并不意味着我们停止了。我们只是改变了。如果你展望未来 15 年,我们可以看到一些变化即将到来,但这并不意味着我们会停止。”英特尔、IBM 和惠普都认同的是,计算性能的未来——也就是说,行业将如何集体以更低的成本提供更高的功能——将不再像一条直线或曲线,而更像生物进化的多分支树。
那是因为我们对计算机本身的愿景正在演变。事实证明,我们并不像 20 世纪后期的科幻小说作家认为的那样想要独立的、像神谕一样的“思考机器”。真正消亡的不是摩尔定律,而是摩尔定律描述和实现的有效通用计算时代。“尽可能地把一切都塞进盒子里,”正如梅伯里所说的那样。
相反,对更低每项功能成本的无情追求将由所谓的异构计算驱动,随着摩尔定律分裂为摩尔定律。IBM、英特尔、惠普和其他公司将集成不仅是电路,而是可以处理不同计算工作负载倍增需求的整个系统。IBM 的伯纳德·S·迈尔森表示,人们购买的是功能,而不是计算机芯片;事实上,他们越来越不感兴趣购买计算机。我们只是希望我们的工具能够以使它们在我们使用的环境中有所帮助的方式进行计算或“思考”。因此,我们没有来自《2001:太空漫游》的超级智能计算机 HAL,而是在智能手机上安装了 Google Now,告诉我们何时出发去机场赶飞机。
尼克·博斯特罗姆(《超级智能:路径、危险、策略》的作者)等未来学家假定,摩尔定律将导致通用人工智能起飞并合并成一种无所不知、无所不能的数字存在。但异构计算表明,计算更可能向外扩散到以前“愚蠢”的对象、系统和利基市场——使汽车、网络路由器、医疗诊断设备和零售供应链等事物具有类似家畜的半自主灵活性和特定于环境的能力。换句话说,在后摩尔定律世界中,计算机不会成为神——但它们会像非常聪明的狗一样行动。
正如大丹犬不是为了做梗犬的工作而建造的那样,图形处理器也不是为了做 CPU 的工作而建造的。惠普的惠勒举例说,多个专用处理核心“螺栓连接到”拍字节级通用内存池——处理能力和海量内存的混合体,其工作方式与现在围绕中央 CPU 资源调用的专用图形加速器和内存缓存非常相似。与此同时,IBM 的莫德哈设想了高尔夫球大小的设备,由固定在廉价摄像头上的认知芯片组成,可以将其投入自然灾害现场,以检测高度特定的模式,例如受伤儿童的存在。加州大学伯克利分校的计算机科学家 Leon Chua 于 1971 年首次提出了忆阻器的存在理论,他说惠普为折叠内存层次结构所做的努力和 IBM 对重新构想 CPU 的研究是对他所谓的“大数据瓶颈”的互补回应。“令人难以置信的是,在过去的 40 年里,我们一直用于一切的计算机仍然都基于计算器般的冯·诺依曼架构的相同想法,”他说。向异构计算的双线过渡是“不可避免的”,他断言,“将创造一个全新的经济体”——尤其因为后摩尔定律、后冯·诺依曼计算将需要全新的编程和系统设计方法。现代计算机科学、工程和芯片设计在很大程度上都与掩盖内存层次结构和冯·诺依曼架构对计算施加的固有局限性有关,蔡教授说,一旦这些局限性被消除,“每个程序员都必须回到学校”。
蔡教授、莫德哈和惠勒在这些近未来的愿景中从未提及晶体管——或世界已经开始期望从晶体管中获得的、可预测的性能提升。根据 IBM 的迈尔森的说法,摩尔定律半个世纪以来准确描述的内容——晶体管密度增加与每项功能成本降低之间的整洁关系——可能最终证明只是暂时的巧合。“如果你看看过去 40 年的半导体,你会看到非常恒定的心跳,”迈尔森说。“并非进展不会继续。但这项技术现在已经发展出心律失常。”
编者注(2015 年 7 月 10 日):本段在发布后进行了编辑,以更正印刷版故事中出现的对戈登·摩尔的错误归因。