首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

智谱发布新一代旗舰模型GLM-5,重点提升编程与智能体能力

发布日期:2026-05-23 来源:gzsihang.com作者:gzsihang.com浏览:1

参数规模翻倍 预训练数据大幅扩容

  智谱新一代旗舰模型GLM-5在模型架构层面实现关键升级。参数规模由上一代扩展,预训练数据量提升至1.5T,更大规模的算力投入驱动通用智能能力显著增强。

  该模型首次引入DeepSeek稀疏注意力机制,在保持长文本处理效果无损的前提下,有效降低部署成本并提升Token利用效率。该技术路线与DeepSeek-V3/V3.2保持一致。

  架构配置方面,GLM-5构建多层隐藏层,集成多个专家模块,每次激活部分专家,激活参数显著提升,稀疏度达90%以上,上下文窗口最高支持数万token。

编程能力显著提升

  新一代旗舰模型GLM-5在内部Claude Code评估集中表现突出。前端、后端及长程任务等编程开发场景下,该模型较上一代GLM-4.7实现全面超越,平均性能提升显著。

  GLM-5能够以极少人工干预,自主完成Agentic长程规划与执行、后端重构、深度调试等复杂系统工程任务。官方称,真实编程环境中的使用体感已逼近Claude Opus 4.5水平。

  智谱将GLM-5定位为最新一代旗舰级对话、编程与智能体模型,重点强化其在复杂系统工程与长程Agent任务中的处理能力。

智能体能力实现开源最优表现

  GLM-5在Agent能力上达成开源SOTA,多项评测基准中位列开源第一。在BrowseComp(联网检索与信息理解)、MCP-Atlas(大规模端到端工具调用)及τ2-Bench(复杂场景下自动代理工具规划与执行)三项测试中,GLM-5均取得最优表现。

  为实现能力突破,该模型构建了全新的“Slime”训练框架,支持更大规模模型架构与更复杂的强化学习任务,显著提升强化学习后训练流程效率。

  此外,智谱提出异步智能体强化学习算法,使模型具备从长程交互中持续学习的能力,有效激发预训练模型的深层潜力。该机制已成为GLM-5的核心技术特色之一。

国产大模型春节档密集发布

  智谱清言GLM-5的发布,成为国产AI大模型春节档密集竞逐的最新注脚。同日晚间,Minimax亦上线Minimax 2.5,距离上一版发布仅间隔一个多月。

  此轮发布潮已持续升温。DeepSeek此前已推出新模型,阿里千问的Qwen 3.5、字节跳动的SeeDance 2.0等产品也于近期相继亮相。多家厂商不约而同选择在春节窗口期集中推新,折射出国产大模型赛道竞争正进入白热化阶段。

  目前GLM-5与Minimax 2.5的详细技术文档尚未完全披露,其实际性能表现仍有待开发者社区与专业机构的后续验证。

本文转载自gzsihang.com, 作者:gzsihang.com, 原文标题:《 智谱发布新一代旗舰模型GLM-5,重点提升编程与智能体能力 》, 原文链接: http://gzsihang.com/jiangxi/70813badc4de2c4AfK5s.html。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅