智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


京公网安备11010602202532号 小鹏集团通用智能中心负责人刘先明在CVPR 2026上首次完整展示小鹏世界模型技术图谱,这是小鹏第三次受邀登上这一国际顶会,也是唯一演讲的中国企业代表。此次披露标志着小鹏智能驾驶技术路线进入“VLA与世界模型双支柱”的新阶段。
刘先明明确回应了行业长期争论的路线问题:VLA与世界模型并非相互竞争。在小鹏架构中,第二代VLA从人类驾驶行为中学习“如何行动”,世界模型则通过对未来状态的预测学习“行动之后世界会如何变化”,二者共同构成物理世界基座模型。
在技术落地层面,第二代VLA已实现量产交付,推送首月用户辅助驾驶里程占比突破50%,成为行业首个达成该数据的系统。该模型拥有数十亿参数量,使用上亿视频片段训练,每版模型训练量超4万亿Token,车端推理速度提升12倍。
小鹏同步披露了世界模型的三项核心能力:主动思考、可控生成和长时序推演。对应技术成果包括:
上述技术形成完整闭环,支撑小鹏物理世界基座模型的持续演进。
“只有能做基座模型的公司,才有可能真的做到L4。”
从硬件层面看,小鹏依托万卡级智算集群,单GPU训练效率一年间提升1010%,GPU硬件利用率从40%提升至90%。搭载第二代VLA的小鹏GX已发布,以其为原型车的Robotaxi也已量产下线,整车有效算力达3000TOPS。
在行业对比上,本届CVPR同台演讲的还包括特斯拉Autopilot负责人Ashok Elluswamy、Waymo研究副总裁Dragomir Anguelov、英伟达感知与机器人研究副总裁Jan Kautz。小鹏与特斯拉在纯视觉路线和基座模型架构演进上正趋于收敛。
刘先明对特斯拉FSD入华持开放态度,认为“市场需要一个正常的对比”。纯视觉方案被小鹏定义为承载基座模型的最优路径——摄像头信息密度远超激光雷达,是训练物理世界基座模型信息密度最高的原材。
展望未来,基座模型将从小鹏汽车延伸至人形机器人IRON、飞行汽车等具身智能场景。IRON量产版本预计年底实现量产,2027年一季度进入门店。自动驾驶只是基座模型落地的第一步,物理AI的规模化扩张正在加速。
小鹏此次技术图谱的完整披露,将行业从“VLA还是世界模型”的二元争论推向融合架构共识。以理解驱动驾驶、以预测实现理解、以规模化赋能预测的技术闭环,正在为L4级自动驾驶铺就基座。
