摩尔线程MTT S5000率先完成对GLM-5的适配-传感器专家网

html

摩尔线程MTT S5000率先完成对GLM-5的适配

2月12日，智谱人工智能正式推出新一代大模型GLM-5。摩尔线程依托SGLang推理框架，在旗舰级AI训推一体全功能GPU MTT S5000上，实现了GLM-5的全流程Day-0适配与验证。

基于MUSA架构广泛的算子覆盖率和强大的生态兼容能力，摩尔线程成功打通了模型推理的整个链路，并深度释放MTT S5000的原生FP8加速潜力。在确保GLM-5模型精度的前提下，有效减少了显存占用，提升了推理效率。此次快速适配不仅验证了MUSA软件栈的技术成熟度，也展示了国产全功能GPU在支持前沿大模型方面的即时响应和强大能力。

GLM-5与MTT S5000的结合，标志着国产技术在AI开发领域迈出了坚实一步。这一组合能够提供媲美国际顶尖模型的编程体验。无论是在代码补全、漏洞识别，还是调试等场景中，都表现出色，尤其在处理复杂的长程任务时，逻辑规划能力显著增强。

GLM-5核心特性

定义Agentic Engineering新高度

作为GLM系列的最新版本，GLM-5定位为当前最先进的代码生成模型，整体性能比前代提升了20%。其核心突破在于具备出色的Agentic Engineering能力，不仅拥有扎实的编程基础，还能胜任系统级别的工程任务和长周期智能代理（Agent）任务，实现了从需求分析到实际应用的端到端开发。

在权威AI评估榜单Artificial Analysis中，GLM-5位列全球第四，位列开源模型之首。其编程能力与Claude Opus 4.5对齐，在SWE-bench-Verified和Terminal Bench 2.0等主流测试中分别取得77.8和56.2的开源模型最高分，表现优于Gemini 3 Pro。

在内部Claude Code评估数据集中，GLM-5在前端开发、后端逻辑、长程任务等编程任务中均优于上一代GLM-4.7，平均提升超过20%。该模型能够在极少人工干预下，独立完成复杂的Agentic长周期任务，包括执行规划、后端重构和深度调试等系统工程，使用体验接近Claude Opus 4.5。

摩尔线程核心优势

软硬协同的全栈算力底座

MTT S5000是专为大模型训练、推理及高性能计算打造的全功能GPU智算卡，采用第四代MUSA架构“平湖”设计。其单卡AI算力最高可达1000 TFLOPS，配备80GB显存，显存带宽高达1.6TB/s，卡间互联带宽为784GB/s，并支持从FP8到FP64的全精度计算。

MTT S5000基于MUSA全栈平台，原生适配PyTorch、Megatron-LM、vLLM及SGLang等主流深度学习框架，支持用户“零成本”迁移代码。无论在构建万卡级训练集群，还是部署高并发、低延迟的在线推理服务中，MTT S5000均展现出与国际旗舰产品相当的性能与稳定性，为行业提供可靠的国产算力基础。

此次GLM-5模型的快速适配，是摩尔线程基于MTT S5000构建的软硬协同技术能力的集中体现。

底层架构与生态兼容：天生适配，极速迁移

针对GLM-5的长序列推理特性，MTT S5000凭借高计算密度和充足的算力储备，结合对稀疏Attention的架构级支持，在处理大规模上下文时仍能保持高效吞吐与低延迟。MUSA软件栈的高敏捷性是实现Day-0适配的关键。TileLang原生算子的单元测试覆盖率超过80%，极大降低了通用算子的移植成本，并能够快速跟进模型结构和新特性演进。

原生FP8加速：SGLang框架深度优化

基于SGLang-MUSA推理引擎与MTT S5000的硬件级FP8计算单元，摩尔线程实现了推理性能的显著提升。与传统BF16方式相比，FP8不仅在生成质量上保持一致，还大幅减少显存占用，提升吞吐能力，为大规模部署提供了更经济的解决方案。

独创ACE引擎：通信计算并行，释放极致吞吐

MTT S5000引入独创的异步通信引擎ACE，将通信任务从计算核心中解耦，实现“通信-计算重叠”的物理级优化。该机制释放了约15%的通信被占算力，结合首创的细粒度重计算技术（开销降低至原来的1/4），从多方面提升系统吞吐与计算效率。

超长上下文支持：专为AI编程打造

通过高效的算子融合和框架深度优化，MTT S5000在确保代码质量的同时显著降低响应延迟。无论是处理复杂的代码库分析还是运行长周期的智能体任务，系统均能保持低首字延迟（TTFT）和高生成速度。MTT S5000与GLM-5的组合在函数补全、漏洞识别等场景中表现突出，是执行复杂开发任务的理想平台。

从GLM-4.6到GLM-4.7，再到GLM-5，摩尔线程已实现“发布即适配”的常态化操作。这种对主流软件栈的无缝兼容与快速响应，印证了国产全功能GPU及MUSA软件栈的成熟与稳定，有助于开发者第一时间应用最新模型能力，共建健康发展的国产AI生态系统。

了解更多关于MTT S5000的信息，请访问：

https://www.mthreads.com/product/S5000

关于摩尔线程

摩尔线程以全功能GPU为核心，致力于为全球用户提供加速计算的基础设施和一站式解决方案，助力各行各业实现数字化与智能化转型。

公司目标是成为国际领先的GPU企业，为融合人工智能与数字孪生的智能世界构建先进计算平台。愿景是为更美好的世界加速。

来源：摩尔线程

摩尔线程MTT S5000率先完成对GLM-5的适配