国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

GLM-5.1登顶全球开源模型第一

　　3月底智谱正式推出了GLM-5.1大模型，编程能力评分45.3分，号称比全球最强的Opus 4.6只低了2.6分。

　　前两天GLM-5.1大模型也正式开源，也深受开发者喜爱，现在最新的排名也来了：全球权威AI评测平台LMArena（百万用户参与盲测）更新Code Arena专项榜单，GLM-5.1登顶全球开源模型第一，位列全球模型第三。

长程任务能力取得突破

　　除了榜单表现优秀，根据智谱的说法，GLM-5.1不仅继承了上一代模型的开源SOTA编码能力，还在长程任务（Long-Horizon Task）上取得突破，实现了：

8小时从零构建Linux桌面

655次迭代打破向量数据库优化瓶颈

1000轮工具调用优化真实机器学习模型负载

　　在METR榜单的同等评估标准下，GLM-5.1是唯一达到8小时级持续工作的开源模型，也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

SWE-bench Pro刷新全球最佳成绩

　　此前智谱提到，GLM-5.1大大提高了代码能力，在完成长程任务方面提升尤为显著。

　　在最接近真实软件开发的SWE-bench Pro基准测试中，GLM-5.1刷新全球最佳成绩，超过GPT-5.4、Claude Opus 4.6。SWE-Bench Pro要求模型在真实GitHub仓库中定位并修复高难度工程Bug，是衡量模型能否胜任专业软件开发的最硬指标。

国产AI大模型GLM-5.1登顶开源第一：可独立编程8小时

智算多多

联系我们

官方邮箱：service@zsdodo.com

公司地址：北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部

关注我们

公众号

视频号