首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

Qwen3.7-Max 发布:阿里千问旗舰模型,Agent前沿能力登顶国产第一

发布日期:2026-05-25 来源:长江证券作者:长江证券

事件评论

  模型基座能力全面跃升,Agentic、推理、通用等能力持续突破。(1)编程智能体方面:多个权威测评中均取得SOTA,Terminal Bench 2.0-Terminus 上取得最高 69.7 分,超过了 DeepSeek-V4-pro-Max、Claude-Opus 4.6。(2)通用智能体方面:提升明显,多项现实能力评测中表现优异,MCP-Atlas 等测试超越GLM-5.1、Kimi-K2.6,创下国产新高。(3)推理方面:在GPQA Diamond、HLE 等核心推理测评中均超越Claude-Opus 4.6及所有国产模型。(4)通用能力与多语言方面,在指令遵循评测IFBench 中得分突破新高达到79.1 分。千问3 系列持续强化编程、长上下文、工具调用、跨框架兼容和长程任务处理能力,这些能力指向同一个变化——模型正在从回答问题,走向执行任务。

  从Coding 的层面上思考,我们认为编程模型竞争正在发生变化,下一阶段的模型竞争,不只是比谁写代码更快,而是比谁能让模型长期、稳定地执行工程任务。模型需要从代码助手向虚拟工程师演进,阿里内部的一个长程任务测试,也体现了这一方向。模型被放到未接触过的新硬件平台平头哥真武M890 上,要求优化生产级注意力内核算子,模型实现连续工作35 小时,内核速度在参考实现基础上提升一个数量级,且连续运行30 小时后模型仍能发现新的优化空间。当前单纯生成代码的价值正在下降,更重要的是理解复杂代码仓库、自主调用工具、运行测试、修复错误,并在多轮反馈中持续调整。

  跟进芯模适配,后续模型将比拼系统级能力。平头哥发布新一代训推一体AI 芯片真武M890,算力底座全面升级,并公布清晰路线图:

  • 性能大幅跃升:自研并行计算架构,性能达上一代真武810E 的3 倍,内置144GB 显存,片间互联带宽800GB/s,原生支持FP32–FP4 全精度,兼顾训练与推理全场景。
  • 集群能力领先:搭配自研ICN Switch1.0 互联芯片,128 张芯片组成单机,P2P 时延<150ns,高效支撑Agent 海量并发推理与大模型训练。
  • 路线规划:未来两年将推出真武V900、真武J900 两代芯片。目前真武系列累计出货56 万片,服务20+行业,400+客户。

  今年大模型行业的竞争周期正在明显缩短,具体演进趋势上,能够看到架构创新加速、芯模适配越发明显,国产模型Infra 能力迅速提升。模型从需求拐点走向需求差异化走向系统级竞争,后续还会继续走向场景端生态端开拓,市场空间持续扩大,阿里云凭借“芯-云-模型-推理”全栈自研能力和Agentic 时代的先发布局,有望加速商业化兑现。

风险提示

  1. AI 技术发展不及预期;
  2. 下游应用需求不及预期。
本文转载自长江证券, 作者:长江证券, 原文标题:《 Qwen3.7-Max 发布:阿里千问旗舰模型,Agent前沿能力登顶国产第一 》, 原文链接: http://stock.finance.sina.com.cn/stock/view/paper.php?reportid=832985718429。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅