by Google DeepMind

Veo — Google 最先进的电影级 AI 视频生成模型。

Veo 是由 Google DeepMind 开发的一系列高保真生成式 AI 视频模型。它能够从文本、图像和视频提示中创建逼真的 1080p 和 4K 视频,并具备精确的物理特性、先进的摄像机语义和原生同步音频。

text-to-videoimage-to-videovideo-to-videoga
Try Veo
Veo — Google 最先进的电影级 AI 视频生成模型。

Veo is a text-to-video / image-to-video / video-to-video model from Google DeepMind. It is currently in ga stage (since 2024-05-14).

What Veo Can Do

  • 原生音频生成

    在生成视频的同时,直接创建上下文准确、同步的音频,包括音效和背景噪音。

  • 电影级摄像机控制

    理解复杂的电影拍摄提示词(例如平移、跟踪、航拍),并呈现连贯、真实的摄像机运动。

  • 图像与视频动画

    将静态图像转换为动态视频,原生扩展现有视频片段,并允许在主体之间进行运动迁移。

  • 快速与轻量模式

    提供速度优化层级(Veo Fast 和 Veo Lite),在保持高保真度的同时,大幅缩短高容量工作流的渲染时间。

Why Veo Is Different

  • 直接集成到 YouTube Shorts 中,允许数百万用户原生生成 AI 视频背景和电影级元素。
  • 生成原生、同步的音频,无需单独的后期处理声音模型。
  • 原生理解先进的电影语义和摄像机物理特性,能准确呈现航拍跟踪和移焦等特定指令。
  • 提供超高性价比的 'Lite' API 层级,旨在为高容量自动化视频流水线压低市场价格。

These claims are drawn from Google DeepMind's own positioning and should be verified against hands-on testing once general access opens.

Specifications

最大分辨率4K (Standard/Pro), 1080p & 720p (Fast/Lite)
宽高比16:9, 9:16
帧率24 - 30 fps
基础时长原生 4 到 8 秒,可通过 API 和循环扩展

Who Uses Veo

社交媒体创作者

Scenario: 直接在 YouTube 应用内生成垂直 B-roll 或完全由 AI 生成的带有原生音频的片段。

Outcome: 无需外部视频编辑流水线,即可快速制作出引人入胜的高质量 YouTube Shorts。

电影制作者与导演

Scenario: 通过提示“无人机跟踪镜头”或“延时摄影”等复杂的摄像机运动,进行场景预视化和分镜制作。

Outcome: 提供能够准确反映技术导演语义的电影级、照片级真实序列。

营销与广告代理商

Scenario: 利用极具成本效益的 Veo Lite 或 Fast API,快速制作原型并对广告创意进行大量 A/B 测试。

Outcome: 显著降低多平台视频广告活动的制作成本并缩短交付周期。

Veo vs Alternatives

vsOnVeoThem
OpenAI Sora生态系统整合直接嵌入 YouTube Shorts 和 Google Photos 等消费者工具中,并提供强大的 Vertex AI 访问权限。在 ChatGPT 生态系统和 OpenAI API 内运行,更侧重于独立的 AI 视频生成,而非社交平台集成。
Runway Gen-3速度与成本提供极其经济的层级,如 Veo Lite/Fast(720p 约为 0.05 美元/秒),优先考虑快速迭代和大容量生成。以颗粒度极细的导演级动态画笔而闻名,但在批量生成流水线中可能速度较慢且成本较高。
Kling AI音频能力具备强大的原生音频生成功能,可自动将完美同步的音景和效果与视觉画面配对。因长时连续生成和运动真实感而广受好评,但以往依赖外部工具或后期制作来处理复杂的同步音频。

FAQ

Google Veo 是否向公众开放?
是的,Veo 已广泛开放。开发者可以通过 Google AI Studio 和 Gemini/Vertex API 使用它,而消费者则可以直接在 YouTube Shorts 和 Google Workspace 应用程序中使用。
Veo 能随视频生成声音吗?
是的,Veo 支持原生音频生成。它会根据您提示词的视觉内容,自动创建同步的音效、环境噪音和匹配的音轨。
Google Veo 的费用是多少?
定价因模型层级而异。高效的 Veo Lite 模型通过 API 生成视频的成本约为每秒 0.05 美元,对于开发者来说极具成本效益,而在 YouTube Shorts 等应用中的消费者使用通常是免费的。
Veo Fast 和 Veo Pro 之间有什么区别?
Veo Fast(及 Lite)模型针对速度和成本效益进行了优化,渲染速度提升至两倍,质量略有权衡。Pro/Standard 模型则优先考虑极致的 4K 保真度和复杂的真实感。

Try Veo Today

Veo 是由 Google DeepMind 开发的一系列高保真生成式 AI 视频模型。它能够从文本、图像和视频提示中创建逼真的 1080p 和 4K 视频,并具备精确的物理特性、先进的摄像机语义和原生同步音频。

Get Started