首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

谷歌全新Gemini Omni首曝,视频版「香蕉」来了,教授黑板推公式全对

发布日期:2026-05-12 来源:36氪作者:36氪浏览:1

原生Gemini Omni,首次曝光了

  就在昨天,Gemini移动端App主页截图流出,一个全新视频模型Gemini Omni入口上线。

  界面中,赫然写着——

快来认识一下我们全新的视频生成模型。重新混剪你的视频,直接在对话中编辑,尝试模板。

  显然,谷歌以全新形式带来了Gemini Omni!

  这可能是一个全模态的Gemini,同时支持文本、图像、音频、视频输入和输出。

  与Veo不同的是,Omni将像Nano Banana一样深度集成到Gemini中,具备更出色的提示理解与推理能力。

  尤其是,在实时视频编辑上,可以一键物体替换,去除水印。

  与此同时,Omni模型的ID也被同时爆出——

  fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200

  可见,Omni生成的视频支持10s时长,分辨率1280x720。

教授黑板推公式,全网震惊

  最炸裂的那个一,便是开篇「教授在黑板上推导三角恒等式」的视频。

  画面中,教授手持粉笔在黑板上一步一步写下数学证明,同时用口语同步讲解当前推导步骤。

  懂行的人看到这会直接跳起来。在AI生成视频里把数学公式写对,这件事有多难?

  文本一致性一直是视频生成模型的「阿喀琉斯之踵」。

  此前,Sora生成的文字经常是看着像字,但仔细一看全是「鬼画符」的状态,更别提完整的数学推导了。

  而Omni的这段demo,公式是对的,推导是连贯的,笔迹是自然的。

  更难以想象的是,这个惊艳的demo,仅用了一句提示词——

  A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.

  许多人看完,直接破防!

  不得不说,AI视频生成已跨越「恐怖谷」,正式进入超写实时代。

  还有灰度到的网友,也做了一批类似的视频,个个都好到爆。

真正的杀手锏:实时编辑

  Gemini Omni强大之处不止于生成,这一次,「实时编辑」也实现了大幅跨越。

  泄露的演示中,Omni展现了令人瞠目的编辑能力——

  • 一键去水印:Omni可以直接对话去水印,且画面毫无破绽;
  • 物体替换: 动动嘴,视频中的物体就被精准替换,光影、遮挡关系全部自动适配;

  再比如,上传一个Sora之前生成的视频,Gemini Omni可以直接去除水印。

  有人对此表示,仅是去水印这一点,足以让这一工具成为创作者的游戏规则改变者。

  不仅如此,Gemini Omni还可以支持风格化输出。

  下面这个动漫风格的视频,蓝色火焰特效、打斗动作线条,每一帧都像是专业动画师手绘的。

视频截图
视频截图

  不过早期测试显示,Gemini Omni额度消耗非常快。

谷歌杀回,Sora 2却关停了

  Gemini Omni泄露的时间点,堪称「精准卡位」。

  就在两周前——4月26日,OpenAI的Sora App正式停服。

  这个曾经让全世界为之疯狂的AI视频生成器,走完了它短暂而戏剧化的一生。

  回顾一下Sora的死因,简直是一部商业悲剧:

  烧钱速度惊人,据称,Sora的推理成本高达每天100万到1500万美元。视频生成比文本和图像生成贵了不止一个量级,而这个成本始终没降下来。

  最关键的是,OpenAI留不住用户。峰值约100万活跃用户,到停服前已跌破50万,30天留存率不到8%。

  整个生命周期的应用内收入仅约210万美元,连一天的算力费都覆盖不了。

  3月24日,Sora官方账号在X上发出那句著名的告别,「We're saying goodbye to the Sora app」。

  API将在9月24日彻底关闭,一个时代结束了。

  谷歌I/O 2026将在5月19日开幕,Gemini Omni极有可能在主舞台上正式亮相。

  AI视频赛道,又要变天了。

  有网友将Omni生成的视频,和Sora 2做了一个直观对比,效果简直差出好几个量级。

  动漫打斗场景中,Gemini Omini丝滑到炸裂,Sora特效却一团乱麻。

I/O倒计时,谷歌摊牌

  除了Omni,谷歌多款尚未正式发布的Gemini「全线模型」被意外推送到生产环境API中。

  此次泄露的模型阵容极其豪华,包括Gemini 3 Flash、3.1全系列(Pro、Flash Image、Lite、TTS),以及专注于高保真音频生成的Lyria 3 Pro。

  最重磅的是,谷歌即将推出的「Omni」原生多模态视频模型,将针对所有的核心模型推出专门的Agent版本。

  I/O主舞台,谷歌要摊牌了!

本文转载自36氪, 作者:36氪, 原文标题:《 谷歌全新Gemini Omni首曝,视频版「香蕉」来了,教授黑板推公式全对 》, 原文链接: https://36kr.com/p/3805677378674185。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅