首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

小鹏CVPR 2026首曝世界模型技术图谱,VLA+世界模型双支柱驱动L4级物理AI基座

发布日期:2026-06-06 来源:网通社作者:网通社

小鹏世界模型技术图谱首曝,VLA与世界模型双支柱驱动L4级物理AI基座

  小鹏集团通用智能中心负责人刘先明在CVPR 2026上首次完整展示小鹏世界模型技术图谱,这是小鹏第三次受邀登上这一国际顶会,也是唯一演讲的中国企业代表。此次披露标志着小鹏智能驾驶技术路线进入“VLA与世界模型双支柱”的新阶段。

小鹏CVPR 2026首曝世界模型技术图谱,VLA+世界模型双支柱驱动L4级物理AI基座-图1
小鹏CVPR 2026首曝世界模型技术图谱,VLA+世界模型双支柱驱动L4级物理AI基座-图1

VLA与世界模型并非对立,而是协同构建物理世界基座

  刘先明明确回应了行业长期争论的路线问题:VLA与世界模型并非相互竞争。在小鹏架构中,第二代VLA从人类驾驶行为中学习“如何行动”,世界模型则通过对未来状态的预测学习“行动之后世界会如何变化”,二者共同构成物理世界基座模型。

第二代VLA已量产交付,用户辅助驾驶里程占比突破50%

  在技术落地层面,第二代VLA已实现量产交付,推送首月用户辅助驾驶里程占比突破50%,成为行业首个达成该数据的系统。该模型拥有数十亿参数量,使用上亿视频片段训练,每版模型训练量超4万亿Token,车端推理速度提升12倍。

世界模型三大核心能力:主动思考、可控生成、长时序推演

  小鹏同步披露了世界模型的三项核心能力:主动思考、可控生成和长时序推演。对应技术成果包括:

  • X-Mind(主动推理与决策可解释性)
  • X-World(可控多视角生成式世界模型)
  • X-Foresight(视觉-动作因果预测网络)
  • X-Cache(推理加速方案)

  上述技术形成完整闭环,支撑小鹏物理世界基座模型的持续演进。

“只有能做基座模型的公司,才有可能真的做到L4。”

万卡级智算集群支撑,硬件效率一年提升超10倍

  从硬件层面看,小鹏依托万卡级智算集群,单GPU训练效率一年间提升1010%,GPU硬件利用率从40%提升至90%。搭载第二代VLA的小鹏GX已发布,以其为原型车的Robotaxi也已量产下线,整车有效算力达3000TOPS。

小鹏CVPR 2026首曝世界模型技术图谱,VLA+世界模型双支柱驱动L4级物理AI基座-图2
小鹏CVPR 2026首曝世界模型技术图谱,VLA+世界模型双支柱驱动L4级物理AI基座-图2

与特斯拉、Waymo等同台,纯视觉路线趋于收敛

  在行业对比上,本届CVPR同台演讲的还包括特斯拉Autopilot负责人Ashok Elluswamy、Waymo研究副总裁Dragomir Anguelov、英伟达感知与机器人研究副总裁Jan Kautz。小鹏与特斯拉在纯视觉路线和基座模型架构演进上正趋于收敛。

  刘先明对特斯拉FSD入华持开放态度,认为“市场需要一个正常的对比”。纯视觉方案被小鹏定义为承载基座模型的最优路径——摄像头信息密度远超激光雷达,是训练物理世界基座模型信息密度最高的原材。

基座模型将拓展至人形机器人、飞行汽车等具身智能场景

  展望未来,基座模型将从小鹏汽车延伸至人形机器人IRON、飞行汽车等具身智能场景。IRON量产版本预计年底实现量产,2027年一季度进入门店。自动驾驶只是基座模型落地的第一步,物理AI的规模化扩张正在加速。

  小鹏此次技术图谱的完整披露,将行业从“VLA还是世界模型”的二元争论推向融合架构共识。以理解驱动驾驶、以预测实现理解、以规模化赋能预测的技术闭环,正在为L4级自动驾驶铺就基座。

本文转载自网通社, 作者:网通社, 原文标题:《 小鹏CVPR 2026首曝世界模型技术图谱,VLA+世界模型双支柱驱动L4级物理AI基座 》, 原文链接: https://m.news18a.com/news/storys_263101.html。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅