摩尔线程发布全新GPU架构与万卡集群，加速AI与图形计算发展-传感器专家网

摩尔线程发布全新GPU架构与万卡集群，加速AI与图形计算发展

在高性能GPU领域，打造具备竞争力的产品不仅意味着突破技术壁垒，还需要构建可持续发展的生态系统，并赢得行业认可。尽管这一过程充满挑战，但近年来，国内GPU自研企业逐渐崭露头角，其中摩尔线程便是典型代表。

在近日举行的首届MUSA开发者大会上，摩尔线程公布了其在国产GPU生态建设方面的多项重要进展和未来战略。大会不仅展示了全新的“花港”GPU架构，还介绍了“华山”、“庐山”系列芯片、“夸娥万卡”智能计算集群，以及面向超大规模智算中心的MTT C256超节点架构和MTT AIBOOK等开发者工具。

作为GPU性能的核心，架构的先进程度直接决定了芯片在计算效率、能效比及图形渲染能力等方面的综合表现。此次推出的“花港”全功能GPU架构在多个关键领域实现了突破。它基于新一代指令集设计，算力密度提升达50%，能效表现也得到显著优化。此外，该架构支持从FP4到FP64的全精度计算，涵盖MTFP6/MTFP4等混合低精度计算模式，从而满足AI训练与推理的不同需求。

“花港”还集成了MTLink高速互联技术，使其具备扩展十万级以上规模智算集群的能力，为大规模分布式AI训练提供了坚实基础。

基于“花港”架构，摩尔线程同步发布了“华山”和“庐山”两款芯片路线。其中，“华山”专注于AI训推一体与超大规模智能计算，其浮点算力、访问带宽、存储容量及互联能力均已达到行业领先水平。“庐山”则主打图形渲染，与初代架构相比，其几何处理性能提升16倍，光线追踪性能提升50倍，AI性能提升64倍，整体3A游戏表现提升15倍。该芯片还具备更高的纹理填充率，并集成AI生成式渲染、UniTE统一渲染架构及新一代光追引擎，为高端游戏和图形创作提供强大算力。

针对大规模AI模型的训练需求，摩尔线程推出了“夸娥万卡”集群，其最高浮点算力可达10Exa-Flops。借助高效的架构设计，该集群在训练算力利用率和有效训练时间等关键指标上持续优化，同时兼容主流国际生态，便于广泛应用于国内外大模型的训练与推理。

在与硅基流动的合作中，摩尔线程通过系统级优化实现了MTT S5000单卡4000 Tokens/s的推理能力，Decode吞吐量更是突破1000 Tokens/s，这一成绩在国内同类产品中处于领先水平，成为国产AI推理性能的新标杆。

对于游戏领域，摩尔线程当前的显卡已支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流图形与计算API。预计到2026年，其产品将进一步支持DirectX 12 Ultimate，并通过内置的硬件光线追踪加速引擎兼容DXR API，从而提升游戏画质的真实性。此外，摩尔线程还推出了全自研的MTAGR 1.0图形渲染架构，为下一代数字内容创作奠定技术基础。

在智能终端市场，摩尔线程发布了“长江”智能SoC芯片，该芯片采用8个全大核设计，最高主频达2.65GHz，集成高性能3D图形渲染单元，支持LLM端侧推理能力，并搭载VPU、DPU、DSP等多种解码模块。基于该芯片打造的MTT E300 AI模组，最高提供50TOPS异构AI算力，适用于工业、能源、教育等多个垂直领域。

在前沿技术布局方面，摩尔线程推出了MT Lambda具身智能仿真训练平台，融合物理引擎、渲染引擎与AI引擎，为智能机器人等具身智能系统提供全栈支持。同时，MUSA架构正逐步拓展至量子计算、AI for 6G等交叉领域。此外，公司还推出了MTT AICube与MTT AIBOOK，为开发者提供高效的开发工具链，助力其在AI时代实现更高效的创新。

本次MUSA开发者大会不仅展示了摩尔线程在GPU架构、芯片设计、AI训练与图形渲染等方面的多项成果，更体现了其在AI与图形计算领域的战略远见。随着AI行业持续爆发，国产GPU企业迎来更多发展机遇，而摩尔线程在技术积累与生态建设上的不断突破，将为其构建自主可控的GPU生态系统打下坚实基础。

摩尔线程发布全新GPU架构与万卡集群，加速AI与图形计算发展