智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


MTT S5000是摩尔线程基于第四代MUSA架构“平湖”打造的一款AI训推一体全功能GPU智算卡,于2024年推出,专为大模型训练、推理及高性能计算设计。
该产品单卡AI稠密算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达1.6TB/s,卡间互联带宽为784GB/s,支持从FP8到FP64的全精度计算。MTT S5000依托MUSA全栈平台,可适配PyTorch、Megatron-LM、vLLM及SGLang等AI框架,应用于夸娥智算集群。
MTT S5000是摩尔线程基于第四代MUSA架构“平湖”打造的AI训推一体全功能GPU智算卡,适用于大模型训练、推理及高性能计算场景。该产品支持从FP8到FP64的全精度计算,配备了硬件级FP8 Tensor Core加速单元。在FP8精度下,其单卡AI稠密算力最高为1000TFLOPS。产品提供液冷和风冷两种形态,液冷版AI算力为1000 TFlops,风冷版为920 TFlops。MTT S5000配备80GB显存,显存带宽为1.6TB/s,卡间互联带宽为784GB/s。产品遵循OAM标准设计。摩尔线程亦推出了搭载8颗MTT S5000的MGX 8-GPU模块化平台和MCCX D800 X2一体化AI服务器。
MTT S5000基于第四代MUSA架构“平湖”打造,是一款全功能GPU,单芯片集成了AI计算、图形渲染、科学计算、超高清视频编解码能力。
MTT S5000在集群通信层面采用ACE(异步通信引擎)技术,将复杂通信任务从计算核心卸载,实现计算与通信的并行,以提升模型算力利用率(MFU)和训练效率。
为了适配大模型训练中多样化的计算负载,MTT S5000对Tensor Core(张量计算核心)与Vector Core(向量计算单元)进行了配置与协同优化。
MTT S5000采用硬件级可信执行环境,并从芯片级到系统级构建了完整的RAS(可靠性、可用性、可维护性)体系。依托MUSA全栈平台,MTT S5000实现了对CUDA语法的高度兼容,支持开发者的应用迁移。
MTT S5000推出后,其规模化量产和集群部署与公司营收增长相关,根据公司财报,2025年营收同比增长243.37%。2026年3月,摩尔线程获得一笔价值6.6亿元的订单。
基于MTT S5000搭建的夸娥万卡集群已落地并上线服务,其浮点运算能力达到10EFLOPS,支持万亿参数大模型训练。
在实际应用层面,MTT S5000应用于多个领域:在智驾仿真领域,与五一视界合作,其SimOne 4.0平台已在MTT S5000上完成适配;在AI科研领域,智源研究院基于MTT S5000千卡集群完成了具身大脑模型RoboBrain 2.5的端到端训练验证;在科学计算领域,通过与国家级实验室合作,在SPONGE模拟引擎、分子对接工具DSDP等应用中实现了性能提升。
2026年3月25日至29日,在北京举行的2026中关村论坛年会“人工智能+”展区,摩尔线程展示了包括MTT S5000在内的全栈自主算力解决方案。
此外,MTT S5000具备生态兼容性和模型适配能力,在2026年春节前后,已完成对GLM-5、MiniMax M2.5、Kimi K2.5及Qwen3.5等大模型的适配。2026年3月,MTT S5000在智源FlagOS平台上完成Qwen3-0.6B模型的全要素训练验证,连续6天无中断稳定训练,并在下游任务评测中较行业标杆基线提升1.65个百分点。
2026年4月12日获悉,摩尔线程AI训推一体全功能GPU MTT S5000已完成对新一代大模型MiniMax M2.7的Day-0极速适配。
摩尔线程技术团队基于MUSA架构(元计算统一系统架构),针对MiniMax M2.7的模型特点完成深度调优,在MTT S5000上实现模型的高性能推理。
