IBM 的 NorthPole AI 芯片将 220 亿个晶体管封装在仅 800 平方毫米的面积内
IBM 的一款名为NorthPole的受大脑启发的芯片在执行人工智能任务时,其速度是目前市场上任何微芯片的 20 倍以上,能效大约是其 25 倍。根据 IBM 的一项研究,新型硅芯片的应用可能包括自动驾驶汽车和机器人。
受大脑启发的计算机硬件旨在模仿人类大脑的卓越能力,以极其节能的方式快速执行计算。这些机器通常用于实现神经网络,神经网络同样模仿大脑学习和操作的方式。
“NorthPole 融合了类脑计算和硅优化计算、计算和内存、硬件和软件之间的界限。”—Dharmendra Modha,IBM
受大脑启发的电子产品经常采用的一种策略是复制生物神经元计算和存储数据的方式。将处理器和内存结合起来可以显着减少计算机在这些组件之间传输数据时损失的能量和时间。
研究主要作者、IBM 类脑计算首席科学家达门德拉·莫哈 (Dharmendra Modha)表示:“大脑比现代计算机节能得多,部分原因是它在每个神经元中都存储着计算记忆。”
“NorthPole 融合了类脑计算和硅优化计算之间、计算和内存之间、硬件和软件之间的界限,”Modha 说。
新芯片针对2位、4位和8位低精度运算进行了优化。研究人员表示,这足以在许多神经网络上实现最先进的准确性,同时无需训练所需的高精度。该研究原型的运行频率范围为 25 至 425 兆赫兹,每个内核每个周期可以以 8 位精度执行 2,048 次操作,以 2 位精度执行 8,192 次操作。
IBM 的 NorthPole AI 芯片作为主动存储设备出现,使其能够更好地集成到更大的系统中
NorthPole 经过过去八年的开发,建立在IBM 最后一款类脑芯片TrueNorth的基础上。TrueNorth 于 2014 年首次亮相,其功效比当时的传统微处理器低四个数量级。
“NorthPole 的主要动机是大幅降低 TrueNorth 的潜在资本成本,”Modha 说。
科学家们使用两个人工智能系统(ResNet 50图像分类网络和Yolo-v4对象检测网络)测试了 NorthPole。与使用类似 12 纳米节点制造的Nvidia V100 GPU相比,NorthPole 每瓦能效提高了 25 倍,速度提高了 22 倍,而占地面积却只有五分之一。
“鉴于模拟系统尚未达到技术成熟度,这项工作为将人工智能部署到需要的地方提供了一个近期选择。”—Vwani Roychowdhury,加州大学洛杉矶分校
NorthPole 的性能也优于市场上所有其他芯片,甚至是采用更先进节点制造的芯片。例如,与使用 4 纳米节点实现的Nvidia H100 GPU相比,NorthPole 的能效提高了五倍。事实证明,NorthPole 的速度大约是 TrueNorth 的 4,000 倍。
“这篇论文代表了工程学的杰作,”未参与这项研究的加州大学洛杉矶分校计算和人工智能科学家Vwani Roychowdhury说道。
新芯片的速度和效率来自于其所有内存都位于芯片本身上。这意味着每个内核都可以轻松地访问芯片上的内存。
此外,从设备外部来看,NorthPole 看起来像是一个主动存储芯片,Modha 说。这有助于将 NorthPole 集成到系统中。
Modha 表示,NorthPole 的潜在应用可能包括图像和视频分析、语音识别以及称为Transformer 的神经网络,这些神经网络是为ChatGPT等聊天机器人提供支持的大型语言模型 (LLM) 的基础。IBM 表示,这些人工智能任务可能会用于自动驾驶汽车、机器人、数字助理和卫星观测等领域。
某些应用程序需要的神经网络太大,无法安装在单个 NorthPole 芯片上。Modha 表示,在这种情况下,这些网络可以分解为更小的部分,并分布在多个 NorthPole 芯片上。
IBM 指出,NorthPole 的效率意味着它不需要笨重的液体冷却系统来运行,风扇和散热器就足够了。这意味着它可以部署在更小的空间中。
科学家们指出,IBM 采用 12 纳米节点工艺制造 NorthPole。目前 CPU 的最先进技术是 3 纳米,IBM 花费了数年时间研究 2 纳米节点。该公司表示,这表明这种受大脑启发的策略可能会带来进一步的收益。
NorthPole 的架构类型通常称为内存计算,可以是数字的也可以是模拟的。在 NorthPole 等数字内存计算系统中,需要许多电路来运行乘法累加 (MAC) 运算,这是神经网络中最基本的计算。相比之下,模拟内存计算系统拥有更适合执行这些操作的组件。
与数字计算相比,模拟内存计算需要更少的功率和空间。然而,这些模拟系统通常需要新材料和制造技术,而 NorthPole 是使用传统半导体制造技术制造的。
Roychowdhury 表示:“鉴于模拟系统尚未达到技术成熟度,这项工作为将人工智能部署到需要的地方提供了一个近期选择。”