美国工程师开发3D芯片,有望突破“内存墙”并提升AI性能十倍
近日,由美国多所顶尖高校的工程师联合发起的一项技术突破引发广泛关注:他们成功研发出一种具有创新架构的三维(3D)芯片。这项技术被普遍认为可能为人工智能(AI)硬件带来革命性变化,在初步测试和计算机仿真中展现出的性能,较当前主流二维(2D)芯片提升近一个数量级。
传统芯片的“天花板”:内存墙与微缩墙
要理解这项技术突破的重要性,需首先了解当前芯片设计所面临的瓶颈。目前,无论是移动设备还是高性能计算系统,其核心芯片仍主要采用2D平面结构,所有逻辑与存储单元均分布在单一的平面上。这一结构长期受到“内存墙”的限制。
在2D芯片中,计算单元的处理速度远高于数据传输速度。受限于内存分布稀疏且路径狭窄,数据在处理器与存储器之间的流动缓慢,成为系统性能提升的主要障碍。
卡内基梅隆大学助理教授、本研究的核心作者Tathagata Srimani对此做了形象说明:“传统芯片就像是只有几部电梯的低层建筑,难以高效地搬运大量‘居民’(数据)。”
设计革新:从“平房”到“摩天大楼”
为了突破“内存墙”瓶颈,研究团队提出了一种全新的芯片设计思路:将传统平面结构转变为三维堆叠架构。
- 垂直堆叠:芯片的各个功能模块被设计成超薄层,类似摩天大楼的楼层数字堆叠。
- 高速互连:内部的垂直互连线路如同高速电梯,实现了计算单元和存储单元之间的快速、大容量数据交换。
这种设计使内存与逻辑单元之间的集成密度大幅提升,有效缓解了长期以来阻碍芯片性能提升的瓶颈问题。宾夕法尼亚大学助理教授Robert M. Radway对此表示:“我们正在构建‘计算领域的曼哈顿’,在有限的物理空间中容纳更多‘数据居民’,应对‘内存墙’与‘微缩墙’的双重挑战。”
性能飞跃:4倍到12倍的提升
实验数据显示,该芯片在多个维度上展现出卓越的性能表现:
- 原型实测:初步测试结果表明,该芯片的性能比当前最先进的2D芯片高出约4倍。
- 仿真预测:通过模拟更高层数的未来版本,研究人员发现其在处理Meta开源的LLaMA等真实AI负载时,性能提升更为明显,最高可达12倍。
- 能效提升:芯片在能效-延迟乘积(EDP)方面展现出显著改进,有望实现高达100至1000倍的提升。这意味着未来的芯片不仅运行速度更快,而且每单位运算的能耗大幅减少。
产业化进展:首次在商用代工厂制造
尤为关键的是,这是首次在商业晶圆代工厂中成功制造出具备明确性能优势的3D芯片。此前,学术界虽已有相关3D芯片的原型,但尚未达到工业化量产的门槛。此次成果意味着这项技术不仅在理论上成立,更具备大规模应用的潜力。
这项研究为芯片制造行业开启了新的可能性。随着人工智能系统对硬件性能需求的持续增长,此类创新将为下一代AI硬件提供坚实支撑。
随着这项技术的不断成熟,由高性能、低能耗AI芯片驱动的智能时代将加速到来。
版权声明:除特殊说明外,本站所有文章均为 字节点击 原创内容,采用 BY-NC-SA 知识共享协议。原文链接:https://byteclicks.com/75094.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有,文章内容仅代表作者独立观点,不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人,只供传递信息之用,非商务用途。如有侵权,请联系 gavin@byteclicks.com。我们将协调给予处理。