华为推出基于昇腾950PR的Atlas 350加速卡 算力性能提升近3倍
在近日举行的华为中国合作伙伴大会2026上,华为正式发布了搭载昇腾950PR(Ascend 950PR)处理器的新一代AI训练与推理加速卡——Atlas 350。这一产品标志着华为在智能计算硬件领域迈出重要一步。
相较于此前的昇腾系列芯片,昇腾950PR在多个关键性能指标上实现了显著优化,尤其是在低精度计算格式支持、向量算力、互联带宽以及高带宽内存(HBM)等方面。
据华为昇腾计算业务总裁张迪煊透露,Atlas 350的单卡算力已达到英伟达H20的2.87倍,并成为国内首款支持FP4低精度推理的AI加速卡。这不仅提升了计算效率,也为复杂模型的部署提供了更强支撑。
从硬件配置来看,Atlas 350的HBM容量提升至112GB,约为H20的1.16倍。同时,多模态生成任务的处理速度有望提高60%。内存访问颗粒度由512字节精简至128字节,使得小算子的访存效率提升了4倍。
在展会现场,华为展示了Atlas 350的关键性能参数:该加速卡在FP4精度下的算力为1.56P,系统带宽可达1.4TB/s,功耗为600W,约为H20的1.5倍。这些数据进一步印证了其在高性能计算场景中的潜力。
除了FP16和FP8外,Atlas 350还引入了对FP4的支持。这意味着搭载该加速卡的服务器能够处理更大规模的AI模型,并在推理任务中实现更低的时延和更高的寄存器利用率。低精度计算的引入,使得整体运算效率得到显著提升。
张迪煊指出,华为将围绕Atlas 350等新一代智能计算产品,聚焦大模型、中型模型和轻量模型三大核心算力场景,协助合作伙伴应对多样化的行业智能化需求,共同推动AI应用的深入发展。