智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


今年兴起的“龙虾”(OpenClaw)热潮展现出人工智能(AI)无所不能的一面,它可以抓数据、写代码、生成大片、接管计算机。然而一旦脱离屏幕,机器人面对现实世界时宛如稚嫩的孩童,仅能完成固定、流程化的动作,“莫拉维克悖论”横亘在人类通往通用人工智能(AGI)的道路上。
世界模型则是破解这一困境的密钥,它可让机器人真正理解物理世界的规律,拥有思考和推理能力,是实现AGI的关键路径。今年,图灵奖得主杨立昆创办世界模型公司,“AI教母”李飞飞的世界模型公司获巨额融资,国内出现超20起世界模型相关融资事件,业内直呼世界模型或是AI下一个10年的重要风口。
多名AI领域的企业家对证券时报记者表示,世界模型能让AI真正实现对物理世界的理解和交互,是实现AGI的必经之路。当下世界模型发展仍处早期,谁能率先撬动物理交互数据飞轮,谁就能抢占发展先机。
OpenAI近日宣布关闭视频生成应用Sora,并调整战略方向:此后Sora团队将专注于世界模型研究。
放弃AI生成现实,转而让AI理解现实,OpenAI的决定映射出行业的下一个战略高地:世界模型。根据复旦大学等高校的阐释,世界模型通过从感官数据中学习和预测运动、力以及空间关系等动态特性,来理解物理世界中事物的性质、运行规律和空间特性。借助世界模型,AI从认知、识别转向理解、推理,是具身智能和客观环境自主高效交互的基础。
AI“思考”的本质是基于数据统计的概率预测,缺乏真正情感和对世界的深层认知。问题的根源在于模型主要建立在语言数据之上,当模型只通过文本学习世界时,其认知边界也被限制在语言所能表达的范围内;而世界模型能让系统通过多模态信息,包括视觉、听觉、空间动态等去刻画环境运行的规律。
复旦大学管理学院院长助理、信息管理与商业智能系系主任张诚在接受证券时报记者采访时表示,AI“思考”的本质是基于数据统计的概率预测,缺乏真正情感和对世界的深层认知。问题的根源在于模型主要建立在语言数据之上,当模型只通过文本学习世界时,其认知边界也被限制在语言所能表达的范围内;而世界模型能让系统通过多模态信息,包括视觉、听觉、空间动态等去刻画环境运行的规律。
世界模型的核心价值,在于通过构建符合物理规则的虚拟平行世界,通过其环境空间理解、长时序推演预测输出决策,实现场景推演、因果预测与长尾场景覆盖,弥补纯数据驱动模型对极端长尾场景泛化能力不足的短板。
毕马威中国汽车行业华东及华西区审计主管合伙人苗桢在接受证券时报记者采访时表示,世界模型的核心价值,在于通过构建符合物理规则的虚拟平行世界,通过其环境空间理解、长时序推演预测输出决策,实现场景推演、因果预测与长尾场景覆盖,弥补纯数据驱动模型对极端长尾场景泛化能力不足的短板。
若没有世界模型,机器人的上限很可能是被动执行代码的高级自动化工具。
