英伟达与阿里:AI产业的度量变革悄然开启
3月17日,英伟达CEO黄仁勋在GTC 2026上进行了长达两个小时的演讲,着标志性皮夹克的他,在舞台上引发热议。会后,“英伟达要做Token之王”的话题迅速在互联网上发酵。
然而,若深入聆听演讲内容,会发现黄仁勋反复强调的并非Token本身,而是“Tokens per Watt(每瓦Token数)”。他在展示推理性能图表时明确指出,数据中心和AI工厂本质上都受到电力的严格限制。一座1GW的AI工厂永远不可能变为2GW,这是由物理法则决定的。
在固定功率的前提下,能够产出更高Token数的企业,其成本控制能力更强,收入曲线也将更为陡峭。这正是GTC 2026真正的核心议题。
尽管业界热议Vera Rubin与Blackwell的性能差异、Groq LPX带来的推理速度提升,甚至英伟达将数据中心带入太空的计划,这些话题固然吸引眼球,但它们背后都指向同一个逻辑:在能源受限的前提下,如何最大化每瓦电力的智能产出。
当英伟达将“Tokens/W”作为衡量AI工厂效率的核心指标时,实际上揭示了一个更深层次的产业变化——算力竞争的度量体系正从芯片层面,转向系统层面,从峰值参数转向端到端能效。
01
GTC2026的焦点:算力基础设施的演进
GTC 2026的热议焦点仍然是Vera Rubin、Rubin POD、LPX、DSX AI Factory等新产品和新技术。但如果将这些发布整合来看,会发现英伟达正在推动算力竞争从单颗芯片的竞争,逐步演化为整个AI基础设施体系的较量。
Rubin被定义为POD-scale platform,多个机架共同构成一个大规模、协调一致的系统;DSX则被定位为面向AI factory的参考设计,目标是提升每瓦Token数。
这表明,产业竞争的焦点已经从单一芯片的算力强度,转向整个计算系统的综合实力。更具体地说,就是如何在有限的电力、冷却和网络条件下,构建出高效的AI产出系统。
衡量这一系统的核心指标,就是每瓦Token数(Token/W)。
本文旨在通过这个度量单位,深入剖析此次发布会传达出的产业信号,以及其对AI基础设施发展的深远影响。
02
系统竞争下,度量体系需超越芯片层
在芯片主导的计算时代,行业惯常使用的度量标准包括峰值算力(FLOPS)、显存带宽、能效(FLOPS/W、TOPS/W、bit/J)等。
这些指标虽然重要,但它们只能描述某个部件的性能边界。在实际的AI计算场景中,智算中心缺乏一个统一、客观、且适用于全系统的度量标准。
当前数据中心的衡量单位通常以兆瓦(MW)表示电力消耗,而在国内建设智算中心时,则常用PFlops(基于FP16)作为算力单位。然而,相同的算力或电力配置,若系统内部的芯片、网络、散热方案不同,实际效能也会存在显著差异。
核心原因在于,现有指标仅能反映单个维度的性能,如峰值算力反映的是芯片的最大运算能力,bit/J体现的是局部数据搬运能效,带宽反映的是子系统的数据传输能力。
然而,一套完整的AI系统最终要解决的问题是:在给定的功率预算、冷却能力和机房物理限制下,系统能够生成多少有效的智能结果。这一问题无法仅通过芯片级指标来解答。
从英伟达的演讲中可见,其重点已转向token cost(成本)、每瓦吞吐量、每瓦token性能以及每瓦Token数。
度量语言正在从“部件语言”转向“系统语言”。
芯片层常用的度量指标,如峰值算力、带宽、bit/J,衡量的是部件能力;而系统层更合理的度量指标,应是Token/W,衡量的是整体产出效率。前者体现局部优化,后者追求系统最优。
03
Token/W连接能源与智能输出
在GTC 2026的演讲中,黄仁勋将Token称为现代AI的基本单元。这一定义十分贴切:对于大语言模型、推理服务或Agent系统而言,客户最终为Token的生成与处理付费。
从业务角度分析,Token具备三个显著优势:一是与模型推理过程高度相关;二是与收入模型直接挂钩;三是能够覆盖推理时代的新负载。
Agent系统、多轮对话、长上下文、检索增强、工具调用、推理链等新型计算任务,难以用单一FLOPS来衡量,却能在Token、延迟(latency)和有效吞吐量(goodput)等维度上留下清晰痕迹。
更重要的是,当前AI基础设施的底层约束,日益表现为能源限制。国际能源署(IEA)的《Energy and AI》报告指出,预计到2030年,全球数据中心的用电量将上升至约945TWh,其中AI是主要驱动因素之一,美国将承担这一增长中的重要份额。
换句话说,AI产业未来将面临越来越多的问题,表面上看是芯片性能问题,实质上是电力、散热和基础设施组织能力的问题。
Token/W之所以具有价值,是因为它构建了AI产业中最关键的链条:电力输入经过计算、网络、存储、调度与冷却,最终转化为Token输出。
从这一视角看,Token/W并非简单替代FLOPS/W或bit/J,而是补充了一个过去未被充分关注的维度:AI系统究竟将多少能源转化成了智能产出。
这次GTC 2026最具讨论价值的地方,恰恰在于这一系统视角的提出。看AI芯片,不能只看算力峰值、内存带宽或接口参数,更要考虑其在网络中的协同能力、在机架中的部署方式、在园区中的供电结构,以及在客户端如何转化为实际业务价值。
当英伟达自身将叙事重心转向AI factory时,行业的关注点已经从“芯片中心主义”转向“计算系统中心主义”。
这一点极为关键。许多产业在早期容易陷入参数竞赛,因为部件参数最容易测量,也最容易宣传。但当产业进入大规模部署阶段,真正决定胜负的往往是系统组织能力。而当前的AI基础设施,正是进入了这一阶段。
04
Token/W推动光互连地位上升
当度量体系转向系统层面,许多过去被视为配套环节的技术,其重要性将显著上升。
光互连就是其中最典型的例子。
传统上,行业讨论光互连时,多从光模块、通信技术和器件视角出发:比如更高的带宽、更低的pJ/bit能效、更优的带宽密度等。这些指标虽然有效,但依然停留在组件或芯片的子系统层级。
在Token/W框架下,光互连的价值将更加直观:它通过降低数据搬运过程中的能耗,提高大规模AI系统中电力到Token的转化效率。
英伟达在演讲中提到,基于光子的CPO(共封装光学)相比传统光模块,能效可提升最高达5倍,延迟也更低,从而支持更大规模的AI factory扩展。
重点已不是链路本身的先进性,而是系统规模和系统能效。
从产业逻辑来看,这种转变顺理成章。随着模型规模不断扩大、上下文长度持续增加、集群规模日益庞大,系统中的能耗不再主要集中在计算单元,而是体现在数据搬运过程中,跨越芯片、板卡、机柜乃至POD之间的通信。
在这一阶段,提高Token/W,已不能仅依赖更强大的GPU,还需要更高效的互连技术。
因此,从Token/W的视角看,光互连的重要性不再仅仅是前沿技术的展示,而是大规模AI系统中不可或缺的节能手段。
05
光计算的前景:从实验室走向产业主线
光计算相较于光互连仍处于更早期的发展阶段。
目前在通用性、精度、编译器、制造一致性及系统集成等方面,仍有诸多挑战需要克服。
但若将视角上升到系统层,光计算的产业价值已变得更加清晰。
在Token/W的框架下,端到端能效成为关键。任何能在高频、高密度、可重复计算路径中显著降低能耗的技术,都将有机会提升系统的Token产出效率。
光计算的逻辑并不依赖于全面替代GPU,也不要求一步到位成为通用计算底座。它只需要在某些关键工作负载中,有效降低整套系统的J/token,提升固定功率预算下的Token产出。
因此,光计算的产业叙事,也应从单点器件效率转向系统层节能贡献。
若行业仍关注TOPS/W或MAC/J,光计算更像是实验室里的研究课题;但如果行业转向Token/W,它便有机会进入基础设施讨论。
这种转变对光计算至关重要,因为这使其得以与客户、园区、电力和资本预算等上层资源展开对话。
06
光技术如何融入AI基础设施主线
当算力竞争还局限于芯片层面时,光互连更像一种I/O技术,光计算更像是前沿探索。
但当算力竞争扩展至大规模AI系统基础设施时,光技术的重要性开始显现。
系统效率越来越依赖于密集计算能耗、数据搬运、上下文管理、跨节点协同、供电与热管理组织。而这些环节,正是光学技术可以发挥最大作用的领域。
从Token/W的角度看,光互连解决的是Token生成背后的数据搬运能耗,而光计算则试图降低每个Token背后的计算能耗。
二者共同影响的是整个系统的Token产出效率。
从现实角度看,未来数据中心和AI factory面临的约束将不仅来自芯片产能与供给,还来自电网接入、机房散热、园区能耗、机柜功率密度以及投产速度。
国际能源署对AI能源消耗的判断,以及英伟达对AI factory的定义,都在指向同一个趋势:AI基础设施正在成为一项以能源为核心考量的系统工程。
从这一趋势出发,光互连和光计算解决的是AI时代越来越昂贵、难以依赖传统电学路径优化的问题:即数据搬运的能耗成本和高密度计算的单位能耗。
这一背后体现的是更全面的系统思维。
这也是GTC 2026再次强调光子与硅光技术产品的原因。
当算力的度量从芯片转向系统,光学技术将从先进选项,逐步转变为值得大规模建设的产业基础设施。
从这一角度看,CPO与光计算系统的发展前景,十分值得期待。
写在最后:AGI时代的推进主线
作者在日常研究中,一直主张建立客观可衡量的算力评价体系,并广泛使用Tokens/W方法来度量不同算力芯片的表现。
回顾科技史,当内燃机的能量与重量比越来越高时,汽车得以诞生,飞机得以起飞,火箭得以升空。
而在AI时代,当AI系统的智能产出(Token)与能量消耗的比值越来越高时,智能将变得更加强大,AGI的诞生也将更有希望。
GTC 2026真正值得铭记的,并非英伟达一家公司的成败,也非黄仁勋是否能成为“Token之王”,而是AI时代新的度量体系的确立。
更进一步地说,英伟达、阿里,甚至更多行业巨头,已开始意识到,必须从系统思维出发,重新审视AI产业的发展。
这一思维,正是人类文明演进的主轴——用更低的能量,采集、传输和处理更多的信息。
AGI的未来,也不会例外。
关于作者
本文作者姚金鑫(J叔),芯片创业者,中国计算机学会高性能计算专业委员会执行委员。
来源:腾讯科技