智算多多

产品服务

Token工厂

算力市场算力商情行业资讯

注册

登录

当前位置: 首页 > 行业资讯 > 资讯详情

谷歌全新Gemini Omni首曝，视频版「香蕉」来了，教授黑板推公式全对

发布日期：2026-05-12 来源：36氪作者：36氪浏览：1

原生Gemini Omni，首次曝光了

　　就在昨天，Gemini移动端App主页截图流出，一个全新视频模型Gemini Omni入口上线。

　　界面中，赫然写着——

快来认识一下我们全新的视频生成模型。重新混剪你的视频，直接在对话中编辑，尝试模板。

　　显然，谷歌以全新形式带来了Gemini Omni！

　　这可能是一个全模态的Gemini，同时支持文本、图像、音频、视频输入和输出。

　　与Veo不同的是，Omni将像Nano Banana一样深度集成到Gemini中，具备更出色的提示理解与推理能力。

　　尤其是，在实时视频编辑上，可以一键物体替换，去除水印。

　　与此同时，Omni模型的ID也被同时爆出——

　　fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200

　　可见，Omni生成的视频支持10s时长，分辨率1280x720。

教授黑板推公式，全网震惊

　　最炸裂的那个一，便是开篇「教授在黑板上推导三角恒等式」的视频。

　　画面中，教授手持粉笔在黑板上一步一步写下数学证明，同时用口语同步讲解当前推导步骤。

　　懂行的人看到这会直接跳起来。在AI生成视频里把数学公式写对，这件事有多难？

　　文本一致性一直是视频生成模型的「阿喀琉斯之踵」。

　　此前，Sora生成的文字经常是看着像字，但仔细一看全是「鬼画符」的状态，更别提完整的数学推导了。

　　而Omni的这段demo，公式是对的，推导是连贯的，笔迹是自然的。

　　更难以想象的是，这个惊艳的demo，仅用了一句提示词——

　　A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.

　　许多人看完，直接破防！

　　不得不说，AI视频生成已跨越「恐怖谷」，正式进入超写实时代。

　　还有灰度到的网友，也做了一批类似的视频，个个都好到爆。

真正的杀手锏：实时编辑

　　Gemini Omni强大之处不止于生成，这一次，「实时编辑」也实现了大幅跨越。

　　泄露的演示中，Omni展现了令人瞠目的编辑能力——

一键去水印：Omni可以直接对话去水印，且画面毫无破绽；
物体替换：动动嘴，视频中的物体就被精准替换，光影、遮挡关系全部自动适配；

　　再比如，上传一个Sora之前生成的视频，Gemini Omni可以直接去除水印。

　　有人对此表示，仅是去水印这一点，足以让这一工具成为创作者的游戏规则改变者。

　　不仅如此，Gemini Omni还可以支持风格化输出。

　　下面这个动漫风格的视频，蓝色火焰特效、打斗动作线条，每一帧都像是专业动画师手绘的。

视频截图

　　不过早期测试显示，Gemini Omni额度消耗非常快。

谷歌杀回，Sora 2却关停了

　　Gemini Omni泄露的时间点，堪称「精准卡位」。

　　就在两周前——4月26日，OpenAI的Sora App正式停服。

　　这个曾经让全世界为之疯狂的AI视频生成器，走完了它短暂而戏剧化的一生。

　　回顾一下Sora的死因，简直是一部商业悲剧：

　　烧钱速度惊人，据称，Sora的推理成本高达每天100万到1500万美元。视频生成比文本和图像生成贵了不止一个量级，而这个成本始终没降下来。

　　最关键的是，OpenAI留不住用户。峰值约100万活跃用户，到停服前已跌破50万，30天留存率不到8%。

　　整个生命周期的应用内收入仅约210万美元，连一天的算力费都覆盖不了。

　　3月24日，Sora官方账号在X上发出那句著名的告别，「We're saying goodbye to the Sora app」。

　　API将在9月24日彻底关闭，一个时代结束了。

　　谷歌I/O 2026将在5月19日开幕，Gemini Omni极有可能在主舞台上正式亮相。

　　AI视频赛道，又要变天了。

　　有网友将Omni生成的视频，和Sora 2做了一个直观对比，效果简直差出好几个量级。

　　动漫打斗场景中，Gemini Omini丝滑到炸裂，Sora特效却一团乱麻。

I/O倒计时，谷歌摊牌

　　除了Omni，谷歌多款尚未正式发布的Gemini「全线模型」被意外推送到生产环境API中。

　　此次泄露的模型阵容极其豪华，包括Gemini 3 Flash、3.1全系列（Pro、Flash Image、Lite、TTS），以及专注于高保真音频生成的Lyria 3 Pro。

　　最重磅的是，谷歌即将推出的「Omni」原生多模态视频模型，将针对所有的核心模型推出专门的Agent版本。

　　I/O主舞台，谷歌要摊牌了！

本文转载自36氪，作者：36氪，原文标题：《谷歌全新Gemini Omni首曝，视频版「香蕉」来了，教授黑板推公式全对》，原文链接： https://36kr.com/p/3805677378674185。本平台仅做分享和推荐，不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题，请与我们联系，我们将在第一时间删除内容！

本文相关推荐

暂无相关推荐

点击立即订阅