Veo 4 类型
Verified专用 AI 视频生成模型,Veo 3.1 的继任者
Veo 4 是 Google DeepMind 预计推出的下一代专用视频模型。Gemini Omni 则是一个在单一流程中处理文本、图像、视频和音频的统一多模态系统。二者很可能在 I/O 2026 同步发布,其中 Veo 4 作为高端专业视频处理引擎,而 Omni 则作为面向消费者的 Gemini 交互界面。

Key facts
专用 AI 视频生成模型,Veo 3.1 的继任者
统一多模态模型,可原生输出文本、图像、视频和音频
Veo 4 为高端 Vertex AI / Flow 视频流程提供支持;Omni 则内嵌于 Gemini 应用中
预计于 2026 年 5 月 19 日的 Google I/O 主题演讲中共同揭晓
Veo 4 和 Gemini Omni 是预计于 2026 年 5 月 19 日至 20 日举行的 I/O 2026 大会上推出的两款 Google AI 模型。截至 2026 年 5 月 18 日,关于这两款模型的信息均源自泄露。在所有相关报道中,最统一的解读是:它们是共享底层架构但面向不同应用界面的同源产品。Veo 4 是专注下一代的视频模型,而 Gemini Omni 是内嵌于 Gemini 应用中的统一多模态系统。
Veo 4 据传是 Google DeepMind Veo 视频系列的下一代迭代产品。据报道其能力包括:
Veo 4 被定位为面向电影制作和企业级用途的高端专业视频模型。
Gemini Omni 是 Google 泄露的统一多模态模型。据报道其能力包括:
Omni 被定位为面向消费者的、处理多格式创意工作的统一流程。
| 维度 | Veo 4 | Gemini Omni | |---|---|---| | 架构 | 专用视频模型 | 统一多模态模型 | | 模态 | 视频(含音频) | 文本 + 图像 + 视频 + 音频 | | 分辨率 | 原生 4K(预期) | 最高 1080p(报道) | | 片段时长 | 预计 30-60 秒 | 据称最高可达 2 小时 | | 摄像机控制 | 多摄像机、动态切换 | 标准电影级控制 | | 界面 | Vertex AI, Google AI Studio, Flow | Gemini 应用, Gemini API | | 目标用户 | 电影制作人、广告商、企业 | 消费者、Gemini 内部创作者 | | 免费层级 | 可能分级(参考 Veo 3.1) | 预期在 Gemini 应用中免费 | | 状态 | 未确认;预计 I/O 2026 发布 | 未确认;预计 I/O 2026 发布 |
在泄露信息中,目前流传着三种解读,第三种与 Google 过往的产品线架构逻辑最为一致。
第三种解读解释了为何两个名字同时出现在泄露中,为何二者都与 I/O 2026 挂钩,以及为何 Google 在为 Gemini 用户提供不同体验的同时,仍能保持 Veo 的企业连续性。
一旦二者正式发布,选择将非常明确:
对于任何需要可探索而非仅供观看的内容,Google 的这两款模型均不适用。这属于诸如 Happy Oyster 和 HY-World 2.0 等 3D 世界模拟器的领域。请参阅 Happy Oyster 对比 Veo 4 和 Happy Oyster 对比 Gemini Omni。
在 I/O 主题演讲中,以下三个问题将得到明确:
如需持续追踪,请查看 Veo 4 发布日期 和 Gemini Omni 发布日期。若需评估当前的跨平台创意工作流,Elser.ai 目前支持桥接不同供应商的图生视频流程。
Mixed signal
截至 2026 年 5 月 18 日,Google 尚未正式确认 Veo 4 和 Gemini Omni。此处描述的能力综合自可靠报道及 Gemini 应用 UI 泄露信息;在 I/O 2026 正式发布前,请将具体细节视为预期。
Readers should expect careful wording here because public reporting confirms the topic, while some product details still need cautious treatment.
推荐工具
无需等待 — 立即使用现有的工具体验 AI 视频生成。
由 Elser.ai 提供支持 — 与上述任何模型无关,独立运行。
尝试 AI 图像动画生成器获取 50 多个经过测试的 AI 视频提示词、对比速查表和工作流程模板,直接发送到你的收件箱。
FAQ
大概率不是。目前的报道分歧虽在,但最可能的方案是:它们共享推理基础设施,但面向不同的产品界面。Veo 4 是高端专业视频流程,而 Omni 是 Gemini 应用内的统一多模态体验。
在基准测试公布前尚不明确。Veo 4 被描述为具备原生 4K 和多摄像机控制的专业电影级流程。据称 Gemini Omni 最高支持 1080p,但生成的片段时长更长。若追求纯粹的电影级保真度,Veo 4 占据优势;若追求长篇连贯内容,Omni 可能更胜一筹。
报道均指向 2026 年 5 月 19-20 日的 Google I/O 联合揭晓,尽管其中一个或两个可能仅以预览版而非正式版形式推出。截至 2026 年 5 月 18 日,Google 尚未正式确认任何一款模型。
不属于此对比范畴。Happy Oyster 是 3D 世界模拟器。Veo 4 和 Gemini Omni 均生成 2D 内容(视频、图像、音频)。对于交互式 3D 环境,Happy Oyster、HY-World 2.0 和 Google Genie 才是该类别的相关产品。