国产GPU技术取得重大突破,四代架构全面超越国际主流产品
天数智芯AI与加速计算技术负责人单天逸在最新技术发布会上,首次公布其下一代GPU架构的发展路线图。根据规划,2025年推出的天数天枢架构将超越NVIDIA的Hopper架构(H200系列),2026年的天数天璇架构对标Blackwell(B200),随后同年发布的天数天玑架构将实现对Blackwell的全面超越。2027年,天数天权架构将挑战NVIDIA尚未公开的Rubin架构,并在2027年之后转向突破性计算芯片架构设计,持续引领行业发展。
面对当前行业普遍存在的能效比偏低、创新能力不足以及部署复杂等挑战,单天逸强调,天数智芯致力于通过架构优化和系统级设计,为客户提供最优的总体拥有成本(TCO)方案,从而有效应对各种复杂应用场景。通过引入高精度仿真技术,用户可在系统部署前精准预测性能表现,实现“所见即所得”的直观效果。同时,平台具备良好的演进能力,能够无缝兼容从传统算法到未来未知算法的升级路径,确保长期价值。
在技术细节方面,四代架构各自具备明确定位与功能增强。天数天枢架构可支持从高精度科学计算到AI精度计算的多种场景,AI芯片在处理注意力机制相关任务时的算力有效利用率超过90%。天数天璇架构则引入了ixFP4精度支持,进一步拓展计算精度范围。天数天玑架构实现了从数据处理到AI训练的全场景覆盖,而天数天权架构则进一步融合多种精度支持与创新设计。
以天数天枢架构为例,其创新点主要体现在多个关键技术上。TPC Broadcast机制通过向上游广播数据,有效减少重复访问存储,等效提升带宽并显著降低功耗。Instruction Co-Exec系统支持多类型指令并行执行,强化复杂任务处理能力。Dynamic Warp Scheduling机制则通过动态调度线程组,避免资源争抢,提高计算资源的整体利用率。
这些创新设计使得天数天枢在整体效率上较当前行业平均水平提升了60%以上。在DeepSeek V3等典型AI训练场景下,其性能表现相比NVIDIA Hopper架构平均高出约20%。
发布会上,天数智芯董事长兼CEO盖鲁江表示,构建AI算力生态需要以全栈自研为基础,同时通过开放合作推动产业模式升级,并以长期主义理念推动国产算力生态的持续繁荣。公司愿与产业链上下游伙伴携手,推动自主通用GPU技术在各行各业的应用落地。
中国工程院院士刘韵洁也出席了活动,并对天数智芯的技术路线和生态建设给予高度评价。他指出,AI算力的发展不仅需要在性能上实现突破,更要注重软硬件协同效率。算力部署应覆盖核心数据中心,同时向边缘和终端延伸,实现对各类应用场景的全面赋能。刘院士充分肯定了天数智芯在自主创新与生态共建方面所取得的成果。