by ByteDance

Seedance 2.0 — 네이티브 오디오를 지원하는 멀티모달 시네마틱 AI 영상 생성 모델.

Seedance 2.0은 ByteDance에서 개발한 고급 멀티모달 비디오 파운데이션 모델입니다. 텍스트, 이미지, 비디오, 오디오 입력을 통합하여 완벽하게 동기화된 네이티브 사운드와 복잡한 물리 법칙이 적용된 고도로 사실적인 다중 샷 시퀀스를 생성합니다.

text-to-videoimage-to-videovideo-to-videoaudio-to-videopublic
Try Seedance 2.0
Seedance 2.0 — 네이티브 오디오를 지원하는 멀티모달 시네마틱 AI 영상 생성 모델.

Seedance 2.0 is a text-to-video / image-to-video / video-to-video / audio-to-video model from ByteDance. It is currently in public stage (since 2026-02-12).

What Seedance 2.0 Can Do

  • 네이티브 오디오 생성

    후반 작업 합성 없이 단일 패스로 영상과 함께 동기화된 대화, 주변 음향 및 배경 음악을 생성합니다.

  • 멀티모달 레퍼런스 혼합

    인라인 '@' 태그를 통해 최대 12개의 레퍼런스 에셋(이미지 9개, 비디오 3개, 오디오 클립 3개)을 동시에 입력받아 출력 생성을 정밀하게 가이드합니다.

  • 장면 확장 및 편집

    기존 영상을 변경하거나 특정 개체를 대체하고, 원래의 카메라 모션을 유지하면서 다음에 일어날 일을 예측하여 장면을 원활하게 확장합니다.

  • 멀티 샷 스토리텔링

    연결된 장면과 시공간적 변화 전반에 걸쳐 일관된 캐릭터, 시각적 스타일 및 환경을 유지합니다.

Why Seedance 2.0 Is Different

  • 모델이 요청된 콘텐츠에 가장 적합한 클립 길이를 자율적으로 결정할 수 있는 지능형 길이 제어 기능(duration: -1) 통합.
  • 실제 물리 법칙을 엄격하게 준수하면서 다수의 참가자가 포함된 경쟁 스포츠 장면(예: 페어 피겨 스케이팅)을 안정적으로 생성하는 최초의 파운데이션 모델.
  • 업계에서 가장 포괄적인 레퍼런스 태깅 시스템을 특징으로 하며, 단일 텍스트 프롬프트 내에 최대 9개의 이미지, 3개의 비디오, 3개의 오디오 파일을 명시적으로 매핑 가능.

These claims are drawn from ByteDance's own positioning and should be verified against hands-on testing once general access opens.

Specifications

샷당 최대 길이15초
출력 해상도1080p (Full HD)
생성당 최대 입력 에셋12개

Who Uses Seedance 2.0

영화 제작자 및 스튜디오

Scenario: 복잡한 인간 상호작용이 포함된 다중 샷 서사 장면 연출.

Outcome: 정밀한 실제 물리 법칙, 일관된 캐릭터, 프레임 수준의 카메라 움직임 제어를 통해 시네마틱 스토리텔링을 구현합니다.

마케팅 및 광고 팀

Scenario: 홍보 캠페인, 제품 쇼케이스, 의상 변경 영상 기획.

Outcome: 실제 세트장 없이 음악에 동적으로 동기화된 완성도 높은 고화질 광고 영상을 제작합니다.

영상 콘텐츠 크리에이터

Scenario: 기존 클립 확장 또는 장면 내 배경 및 캐릭터 변경.

Outcome: 원본 영상의 모션과 미학을 완벽하게 유지하면서 새로운 창의적 연출을 매끄럽게 통합합니다.

Seedance 2.0 vs Alternatives

vsOnSeedance 2.0Them
Sora (OpenAI)오디오 통합단일 통합 패스로 네이티브하고 완벽하게 동기화된 립싱크와 오디오를 유기적으로 생성합니다.전통적으로 시각적 생성에 집중해왔으며, 사운드 디자인을 위해 타사 도구가 필요한 경우가 많습니다.
Kling 3.0복합 다중 에셋 입력구조적 '@' 태그를 통해 최대 12개의 멀티모달 레퍼런스(이미지, 오디오, 비디오)를 동시에 결합하여 감독 수준의 가이드를 지원합니다.강력한 캐릭터 일관성을 제공하지만, 오디오, 시각, 모션 레퍼런스를 동시에 혼합하기 위한 통합 프레임워크는 덜 강력합니다.
Runway Gen-3 Alpha복잡한 모션 물리 법칙실제 물리 법칙을 엄격히 준수하며 다수의 참가자가 포함된 경쟁 스포츠 장면 및 복잡한 상호작용을 안정적으로 생성합니다.기본적인 상호작용은 잘 처리하지만, 격렬한 스포츠나 복잡한 다중 피사체 상호작용 중에는 때때로 구조적 안정성이 흔들릴 수 있습니다.

FAQ

Seedance 2.0이란 무엇인가요?
Seedance 2.0은 ByteDance가 개발한 고급 멀티모달 영상 생성 모델로, 텍스트, 이미지, 비디오 및 오디오 입력을 받아 네이티브하게 동기화된 사운드를 포함한 고품질 시네마틱 1080p 영상을 생성합니다.
Seedance는 영상과 함께 오디오도 생성하나요?
네, Seedance 2.0은 단일 패스로 오디오와 비디오를 동시에 생성합니다. 여기에는 립싱크 대화, 음향 효과 및 배경 음악이 포함되어 있어 후반 작업에서 별도로 레이어를 추가할 필요가 없습니다.
Seedance로 생성한 영상의 길이는 어느 정도인가요?
Seedance 2.0은 샷당 최대 15초 길이의 매우 상세한 영상 클립을 생성할 수 있으며, 다중 샷 연속성을 지원하여 이들을 더 긴 서사로 연결할 수 있습니다.
할리우드에서 Seedance를 우려하는 이유는 무엇인가요?
출시 이후, 주요 영화 제작사와 MPA는 ByteDance가 저작권이 있는 영화와 쇼를 사용하여 Seedance를 학습시켰다고 비난했으며, 승인되지 않은 유명인의 딥페이크 및 저작권 보호 캐릭터의 바이럴 생성을 그 근거로 들었습니다.

Try Seedance 2.0 Today

Seedance 2.0은 ByteDance에서 개발한 고급 멀티모달 비디오 파운데이션 모델입니다. 텍스트, 이미지, 비디오, 오디오 입력을 통합하여 완벽하게 동기화된 네이티브 사운드와 복잡한 물리 법칙이 적용된 고도로 사실적인 다중 샷 시퀀스를 생성합니다.

Get Started