智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


京公网安备11010602202532号 中国信息通信研究院总工程师 何宝宏
尊敬的各位领导、各位专家,大家好!很高兴有机会再次来到数字经济论坛,分享我和团队关于人工智能发展的最新观察、理解与思考。内容不一定完全准确,供大家批评指正。
今年的《政府工作报告》首次提出“打造智能经济新形态”,这标志着数字经济发展进入了新阶段。过去我们强调数字化、网络化,现在更突出AI赋能千行百业,产业发展进入智能化高级阶段。
从技术角度看,基础大模型在过去一年,无论是语言模型还是多模态模型,都取得了长足进步,但呈现出新特点:语言大模型过去几年能力年均提升约35%,但增长逻辑出现转折——不再单纯依靠“模型越大、效果越好”,而是通过模型扩展、外挂工具等方式,技术路线发生了微妙变化。多模态模型的进步更为显著,过去一年能力提升50%以上,产业创新重心正从语言模型加速转向多模态,各类技术瓶颈不断被突破。
开源模型能力已接近闭源,差距持续缩小。开源赛道呈现收敛趋势,历史上开源模型数量曾超200个,如今下载量、使用量及衍生模型高度集中于头部。TOP5开源模型下载量占比超过83%,可以看到,Meta与DeepSeek明显占据了榜单前面,开源模型也在走向收敛。
仅有语言模型和多模态还不够,智能需要与物理世界交互,物理仿真、现实建模能力仍显不足。学术界正积极探索构建世界模型,最简单路径是语言大模型与物理世界融合。目前世界模型研究尚处初期,方向明确,但技术路线仍存较大分歧。一旦世界模型成熟,元宇宙也将迎来真正落地。
再往上走是数据,数据是一个重大的挑战。过去一段时间,模型的能力不能仅依靠模型越大来支撑,今天的数据预训练撞上了墙,难以找到新的数据来提升它,数据成了制约模型能力提升的一个核心性的因素。
如果是数据部门,或者做大数据要素,你会说数据太多了,体量大,类型多。如果做大模型,反过来就会说数据太少了,质量也不高,互相甩锅,这是一个正常的现象,不是数据不够,是模型不好。
为了解决今天的公共互联网上的公用数据基本消耗殆尽的问题,如何挖掘更多的数据价值:
算力在过去一年的时间里,热点层出不穷:
Agent的技术框架已经初步确定。开源领域发展迅速,通过整理人编写的“说明书”并面向机器优化,使机器更准确理解指令,形成有效技术路径。
此外,模型输出具有概率性,可能出现错误。当概念性错误发生时,如何控制模型沿正确轨迹运行,成为全新挑战。所有智能系统都可能“发疯”,风险必须可控。从计算机时代的软件工程,到互联网时代的分布式工程,如今亟需“驾驭工程”,将不确定性转化为可控确定性。
具身智能目前已取得长足发展,但产品仍集中于特定场景。领先应用已能实现自主执行,这是重要飞跃。未来目标是泛化至更多场景,摆脱遥控依赖,实现真正自主。
当前面临两大关键挑战:
AI产品形态越来越多,AI手机、AIPC、AI眼镜等设备形态明显日益丰富和完善。
走到今天,AI正在向各行各业持续渗透,但渗透次序不同——语言类应用渗透较快,持续推动人类社会进步。人工智能正在迎来“智变”,我们做好准备了吗?
