首页
智算服务
AI 生态大厅
算力商情政策资讯合作与生态场景方案关于我们
控制台

林俊旸阿里离职后发长文:大模型演进路线正从“推理型”全面转向“智能体”

发布日期:2026-03-27 来源:百家号作者:百家号

AI大模型竞争焦点转向“智能体思考”

前阿里千问技术负责人林俊旸离职后发表长文,明确指出AI大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。

文章复盘了以OpenAI o1和DeepSeek-R1为代表的第一波推理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。

融合思考与指令模式的落地困境

林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过Qwen3打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量Token进行复杂推演,两者在数据分布和行为目标上存在根本冲突。

若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen在后续的2507版本中选择推出了分离的30B和235B指令与思考变体。

与之形成对比的是,Anthropic和DeepSeek等厂商则继续在统合推理与工具调用的混合架构上进行探索。

下一阶段:智能体思考主导未来

针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代计划的智能体思考。

智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。

随着大模型获得搜索、代码执行等工具权限,防范奖励作弊(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防作弊协议以及多智能体协同编排等系统工程能力上。

本文转载自百家号, 作者:百家号, 原文标题:《 林俊旸阿里离职后发长文:大模型演进路线正从“推理型”全面转向“智能体” 》, 原文链接: https://baijiahao.baidu.com/s?id=1860767085049229027&wfr=spider&for=pc。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐