摩尔线程发布全新GPU架构与万卡集群,加速AI与图形计算发展

2025-12-21 00:17:34
关注

摩尔线程发布全新GPU架构与万卡集群,加速AI与图形计算发展

在高性能GPU领域,打造具备竞争力的产品不仅意味着突破技术壁垒,还需要构建可持续发展的生态系统,并赢得行业认可。尽管这一过程充满挑战,但近年来,国内GPU自研企业逐渐崭露头角,其中摩尔线程便是典型代表。

在近日举行的首届MUSA开发者大会上,摩尔线程公布了其在国产GPU生态建设方面的多项重要进展和未来战略。大会不仅展示了全新的“花港”GPU架构,还介绍了“华山”、“庐山”系列芯片、“夸娥万卡”智能计算集群,以及面向超大规模智算中心的MTT C256超节点架构和MTT AIBOOK等开发者工具。

作为GPU性能的核心,架构的先进程度直接决定了芯片在计算效率、能效比及图形渲染能力等方面的综合表现。此次推出的“花港”全功能GPU架构在多个关键领域实现了突破。它基于新一代指令集设计,算力密度提升达50%,能效表现也得到显著优化。此外,该架构支持从FP4到FP64的全精度计算,涵盖MTFP6/MTFP4等混合低精度计算模式,从而满足AI训练与推理的不同需求。

“花港”还集成了MTLink高速互联技术,使其具备扩展十万级以上规模智算集群的能力,为大规模分布式AI训练提供了坚实基础。

基于“花港”架构,摩尔线程同步发布了“华山”和“庐山”两款芯片路线。其中,“华山”专注于AI训推一体与超大规模智能计算,其浮点算力、访问带宽、存储容量及互联能力均已达到行业领先水平。“庐山”则主打图形渲染,与初代架构相比,其几何处理性能提升16倍,光线追踪性能提升50倍,AI性能提升64倍,整体3A游戏表现提升15倍。该芯片还具备更高的纹理填充率,并集成AI生成式渲染、UniTE统一渲染架构及新一代光追引擎,为高端游戏和图形创作提供强大算力。

针对大规模AI模型的训练需求,摩尔线程推出了“夸娥万卡”集群,其最高浮点算力可达10Exa-Flops。借助高效的架构设计,该集群在训练算力利用率和有效训练时间等关键指标上持续优化,同时兼容主流国际生态,便于广泛应用于国内外大模型的训练与推理。

在与硅基流动的合作中,摩尔线程通过系统级优化实现了MTT S5000单卡4000 Tokens/s的推理能力,Decode吞吐量更是突破1000 Tokens/s,这一成绩在国内同类产品中处于领先水平,成为国产AI推理性能的新标杆。

对于游戏领域,摩尔线程当前的显卡已支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流图形与计算API。预计到2026年,其产品将进一步支持DirectX 12 Ultimate,并通过内置的硬件光线追踪加速引擎兼容DXR API,从而提升游戏画质的真实性。此外,摩尔线程还推出了全自研的MTAGR 1.0图形渲染架构,为下一代数字内容创作奠定技术基础。

在智能终端市场,摩尔线程发布了“长江”智能SoC芯片,该芯片采用8个全大核设计,最高主频达2.65GHz,集成高性能3D图形渲染单元,支持LLM端侧推理能力,并搭载VPU、DPU、DSP等多种解码模块。基于该芯片打造的MTT E300 AI模组,最高提供50TOPS异构AI算力,适用于工业、能源、教育等多个垂直领域。

在前沿技术布局方面,摩尔线程推出了MT Lambda具身智能仿真训练平台,融合物理引擎、渲染引擎与AI引擎,为智能机器人等具身智能系统提供全栈支持。同时,MUSA架构正逐步拓展至量子计算、AI for 6G等交叉领域。此外,公司还推出了MTT AICube与MTT AIBOOK,为开发者提供高效的开发工具链,助力其在AI时代实现更高效的创新。

本次MUSA开发者大会不仅展示了摩尔线程在GPU架构、芯片设计、AI训练与图形渲染等方面的多项成果,更体现了其在AI与图形计算领域的战略远见。随着AI行业持续爆发,国产GPU企业迎来更多发展机遇,而摩尔线程在技术积累与生态建设上的不断突破,将为其构建自主可控的GPU生态系统打下坚实基础。

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

广告

热点科技

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

2026深圳国际人工智能展览会(高交会)

提取码
复制提取码
点击跳转至百度网盘