
视频大模型是以生成、编辑视频为核心任务的人工智能模型,属于“大模型种类”范畴,具备自然语言理解、多模态交互等技术特征。自2024年2月国际同类模型Sora发布后,国内腾讯、阿里巴巴、字节跳动等互联网企业加速布局,截至2024年12月已涌现20余款国产视频大模型。代表性产品包括阿里巴巴的AtomoVideo、腾讯的VideoCrafter、快手的可灵等,普遍支持文生视频、图生视频等功能。进入2025年,国产视频大模型在生成效率与物理仿真精度方面持续改进,制作成本也有所降低。百度发布原生全模态大模型“文心大模型5.0”,其参数规模达到2.4万亿,采用原生全模态统一建模技术,在涵盖语言与多模态理解的40余项权威基准综合评测中,能力与Gemini-2.5-Pro、GPT-5-High等国际先进模型持平;其图像与视频生成能力亦达到垂直领域专精模型水平。2026年,国产视频大模型在技术方面持续创新,例
查看详情









