智谱发布新一代旗舰模型GLM-5，重点提升编程与智能体能力

参数规模翻倍预训练数据大幅扩容

　　智谱新一代旗舰模型GLM-5在模型架构层面实现关键升级。参数规模由上一代扩展，预训练数据量提升至1.5T，更大规模的算力投入驱动通用智能能力显著增强。

　　该模型首次引入DeepSeek稀疏注意力机制，在保持长文本处理效果无损的前提下，有效降低部署成本并提升Token利用效率。该技术路线与DeepSeek-V3/V3.2保持一致。

　　架构配置方面，GLM-5构建多层隐藏层，集成多个专家模块，每次激活部分专家，激活参数显著提升，稀疏度达90%以上，上下文窗口最高支持数万token。

编程能力显著提升

　　新一代旗舰模型GLM-5在内部Claude Code评估集中表现突出。前端、后端及长程任务等编程开发场景下，该模型较上一代GLM-4.7实现全面超越，平均性能提升显著。

　　GLM-5能够以极少人工干预，自主完成Agentic长程规划与执行、后端重构、深度调试等复杂系统工程任务。官方称，真实编程环境中的使用体感已逼近Claude Opus 4.5水平。

　　智谱将GLM-5定位为最新一代旗舰级对话、编程与智能体模型，重点强化其在复杂系统工程与长程Agent任务中的处理能力。

智能体能力实现开源最优表现

　　GLM-5在Agent能力上达成开源SOTA，多项评测基准中位列开源第一。在BrowseComp（联网检索与信息理解）、MCP-Atlas（大规模端到端工具调用）及τ2-Bench（复杂场景下自动代理工具规划与执行）三项测试中，GLM-5均取得最优表现。

　　为实现能力突破，该模型构建了全新的“Slime”训练框架，支持更大规模模型架构与更复杂的强化学习任务，显著提升强化学习后训练流程效率。

　　此外，智谱提出异步智能体强化学习算法，使模型具备从长程交互中持续学习的能力，有效激发预训练模型的深层潜力。该机制已成为GLM-5的核心技术特色之一。

国产大模型春节档密集发布

　　智谱清言GLM-5的发布，成为国产AI大模型春节档密集竞逐的最新注脚。同日晚间，Minimax亦上线Minimax 2.5，距离上一版发布仅间隔一个多月。

　　此轮发布潮已持续升温。DeepSeek此前已推出新模型，阿里千问的Qwen 3.5、字节跳动的SeeDance 2.0等产品也于近期相继亮相。多家厂商不约而同选择在春节窗口期集中推新，折射出国产大模型赛道竞争正进入白热化阶段。

　　目前GLM-5与Minimax 2.5的详细技术文档尚未完全披露，其实际性能表现仍有待开发者社区与专业机构的后续验证。

智算多多

联系我们

官方邮箱：service@zsdodo.com

公司地址：北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部

关注我们

公众号

视频号

参数规模翻倍 预训练数据大幅扩容