首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

发布日期:2026-04-11 来源:站长之家作者:站长之家浏览:2

GLM-5.1登顶全球开源模型第一

  3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。

  前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了:全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。

长程任务能力取得突破

  除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:

  • 8小时从零构建Linux桌面
  • 655次迭代打破向量数据库优化瓶颈
  • 1000轮工具调用优化真实机器学习模型负载

  在METR榜单的同等评估标准下,GLM-5.1是唯一达到8小时级持续工作的开源模型,也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

SWE-bench Pro刷新全球最佳成绩

  此前智谱提到,GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。

  在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成绩,超过GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug,是衡量模型能否胜任专业软件开发的最硬指标。

国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时
国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时
国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时
国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时
本文转载自站长之家, 作者:站长之家, 原文标题:《 国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时 》, 原文链接: https://www.chinaz.com/2026/0411/1745873.shtml。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅