by ByteDance

Seedance 2.0 — Geração de vídeo de IA cinematográfica multimodal com áudio nativo.

O Seedance 2.0 é um modelo avançado de fundação de vídeo multimodal criado pela ByteDance. Ele unifica entradas de texto, imagem, vídeo e áudio para gerar sequências de múltiplas tomadas altamente realistas, com som nativo perfeitamente sincronizado e física complexa.

text-to-videoimage-to-videovideo-to-videoaudio-to-videopublic
Try Seedance 2.0
Seedance 2.0 — Geração de vídeo de IA cinematográfica multimodal com áudio nativo.

Seedance 2.0 is a text-to-video / image-to-video / video-to-video / audio-to-video model from ByteDance. It is currently in public stage (since 2026-02-12).

What Seedance 2.0 Can Do

  • Geração de Áudio Nativo

    Cria diálogos sincronizados, paisagens sonoras ambientes e música de fundo junto com o vídeo em uma única etapa, sem a necessidade de junção na pós-produção.

  • Mixagem de Referências Multimodais

    Aceita até 12 ativos de referência simultaneamente (9 imagens, 3 vídeos, 3 clipes de áudio) via marcações '@' no texto para guiar a geração de saída com precisão.

  • Extensão e Edição de Cenas

    Altera vídeos existentes, substitui objetos específicos ou estende cenas perfeitamente, prevendo o que acontece a seguir enquanto preserva o movimento original da câmera.

  • Narrativa de Múltiplas Tomadas

    Mantém personagens, estilos visuais e ambientes consistentes através de cenas conectadas e mudanças temporais-espaciais.

Why Seedance 2.0 Is Different

  • Integra um recurso de controle de duração inteligente (duração: -1) que permite ao modelo determinar de forma autônoma a melhor duração do clipe para o conteúdo solicitado.
  • Primeiro modelo fundacional a gerar de forma confiável cenas de esportes competitivos com múltiplos participantes (como patinação artística em pares) ao mesmo tempo que adere estritamente às leis físicas do mundo real.
  • Apresenta o sistema de marcação de referência mais abrangente do setor, aceitando até 9 imagens, 3 vídeos e 3 arquivos de áudio mapeados explicitamente dentro de um único prompt de texto.

These claims are drawn from ByteDance's own positioning and should be verified against hands-on testing once general access opens.

Specifications

Duração Máxima por Tomada15 segundos
Resolução de Saída1080p (Full HD)
Máximo de Ativos de Entrada por Geração12 itens

Who Uses Seedance 2.0

Cineastas e Estúdios

Scenario: Direção de cenas narrativas com múltiplas tomadas com interações humanas complexas.

Outcome: Alcança uma narrativa cinematográfica com física do mundo real precisa, personagens consistentes e controle de movimentos de câmera no nível do quadro.

Equipes de Marketing e Publicidade

Scenario: Elaboração rápida de campanhas promocionais, vitrines de produtos e vídeos de troca de roupas.

Outcome: Produz vídeos comerciais polidos e de alta definição, dinamicamente sincronizados com a música, sem precisar de um cenário físico.

Criadores de Conteúdo em Vídeo

Scenario: Extensão de clipes existentes ou alteração de planos de fundo e personagens dentro de uma tomada.

Outcome: Integra perfeitamente a nova direção criativa à filmagem original, combinando perfeitamente o movimento e a estética originais.

Seedance 2.0 vs Alternatives

vsOnSeedance 2.0Them
Sora (OpenAI)Integração de ÁudioGera sincronia labial e áudio de forma nativa, perfeitamente sincronizados de maneira orgânica em uma única etapa unificada.Historicamente focado na geração visual silenciosa, frequentemente exigindo ferramentas de terceiros para design de som.
Kling 3.0Entradas Complexas de Múltiplos AtivosSuporta orientação de nível de diretor ao combinar até 12 referências multimodais (imagens, áudio, vídeo) via marcações estruturais '@' simultaneamente.Oferece forte consistência de personagens, mas tem uma estrutura unificada menos robusta para a mixagem de referências simultâneas de áudio, visuais e de movimento.
Runway Gen-3 AlphaFísica Complexa de MovimentoCapaz de gerar de forma confiável cenas de esportes competitivos com múltiplos participantes e interações complexas aderindo de perto à física do mundo real.Lida bem com interações básicas, mas ocasionalmente pode ter dificuldades com a estabilidade estrutural durante esportes de alto contato ou interações complexas com múltiplos sujeitos.

FAQ

O que é o Seedance 2.0?
O Seedance 2.0 é um modelo avançado de geração de vídeo multimodal desenvolvido pela ByteDance que aceita entradas de texto, imagem, vídeo e áudio para criar clipes cinematográficos de alta qualidade em 1080p com som sincronizado nativamente.
O Seedance gera áudio com seus vídeos?
Sim, o Seedance 2.0 gera áudio e vídeo juntos em uma única etapa. Isso inclui diálogos com sincronia labial, efeitos sonoros e música de fundo, eliminando a necessidade de camadas na pós-produção.
Qual a duração máxima dos vídeos gerados pelo Seedance?
O Seedance 2.0 pode gerar clipes de vídeo altamente detalhados de até 15 segundos de duração por tomada e suporta a continuidade de múltiplas tomadas para uni-las em narrativas mais longas.
Por que Hollywood está preocupada com o Seedance?
Após seu lançamento, os principais estúdios de cinema e a MPA acusaram a ByteDance de treinar o Seedance em filmes e séries protegidos por direitos autorais, apontando para a geração viral de sósias não autorizados de celebridades e personagens protegidos.

Try Seedance 2.0 Today

O Seedance 2.0 é um modelo avançado de fundação de vídeo multimodal criado pela ByteDance. Ele unifica entradas de texto, imagem, vídeo e áudio para gerar sequências de múltiplas tomadas altamente realistas, com som nativo perfeitamente sincronizado e física complexa.

Get Started