ByteDance
Seedance 2.0
原生音频驱动的多模态电影级 AI 视频生成。
- 内置智能时长控制功能(duration: -1),允许模型根据所需内容自主确定最佳片段长度。
- 首个能够可靠生成多参与者竞技体育场景(如双人花样滑冰),同时严格遵守现实物理定律的基础模型。
- 拥有业界最全面的参考标记系统,支持在单个文本提示词中明确映射多达 9 个图像、3 个视频和 3 个音频文件。
ByteDance vs Google DeepMind
Seedance 2.0 (原生音频驱动的多模态电影级 AI 视频生成。) compared to Veo (Google 最先进的电影级 AI 视频生成模型。).

Seedance 2.0 and Veo target adjacent jobs but take different approaches. This page compares them side by side on output paradigm, access, capabilities, and positioning — based on vendor-stated claims as of 2026-04-21 / 2026-04-21.
ByteDance
原生音频驱动的多模态电影级 AI 视频生成。
Google DeepMind
Google 最先进的电影级 AI 视频生成模型。
| Dimension | Seedance 2.0 | Veo |
|---|---|---|
| Modality | text-to-video, image-to-video, video-to-video, audio-to-video | text-to-video, image-to-video, video-to-video |
| Release status | public (2026-02-12) | ga (2024-05-14) |
| Capabilities | 原生音频生成 · 多模态参考混合 · 场景扩展与编辑 · 多镜头叙事 | 原生音频生成 · 电影级摄像机控制 · 图像与视频动画 · 快速与轻量模式 |
| 单镜头最长时长 | 15 秒 | — |
| 输出分辨率 | 1080p (全高清) | — |
| 单次生成最大参考资产数 | 12 个 | — |
| 最大分辨率 | — | 4K (Standard/Pro), 1080p & 720p (Fast/Lite) |
| 宽高比 | — | 16:9, 9:16 |
| 帧率 | — | 24 - 30 fps |
| 基础时长 | — | 原生 4 到 8 秒,可通过 API 和循环扩展 |