영상 렌더링이 아닌 월드 연출
디렉팅 모드를 사용하면 자연어 명령으로 실시간으로 장면을 구성할 수 있습니다. 노을을 추가하거나 나무를 옮기고 날씨를 바꾸는 등 모든 변경 사항이 유지됩니다. 고정된 영상을 생성하는 것이 아니라, 하나의 공간을 기획하는 것입니다.
by Alibaba ATH Innovation Division
단순한 영상 생성을 넘어, 크리에이터가 생성형 3D 환경을 실시간으로 연출하고 탐험할 수 있게 해주는 Alibaba의 차세대 월드 모델입니다.

Happy Oyster sits in an emerging category that Alibaba is calling interactive world models — closer to a generative game engine than to a text-to-video system. Two modes (Directing and Wandering) correspond to two jobs a creator actually has: shaping the scene, and living inside it. Most of the 2026 video-model race is still optimizing frame quality; Happy Oyster is instead optimizing for what happens after the first generation — whether a scene is a throwaway artifact or a place you can return to.
The three things that separate Happy Oyster from the video-model pack. Two of these claims hold up under hands-on testing; the audio one needs more samples before I'd commit.
디렉팅 모드를 사용하면 자연어 명령으로 실시간으로 장면을 구성할 수 있습니다. 노을을 추가하거나 나무를 옮기고 날씨를 바꾸는 등 모든 변경 사항이 유지됩니다. 고정된 영상을 생성하는 것이 아니라, 하나의 공간을 기획하는 것입니다.
The re-entry promise is the load-bearing claim. If the geometry stays consistent across sessions, this is a generative game engine, not a video model. Test it by walking the same scene twice an hour apart and comparing screenshots from the same camera position.
소리는 나중에 입히는 것이 아니라 장면과 동시에 생성됩니다. 지표면에 맞는 발자국 소리, 공간에 어울리는 환경음이 생성됩니다. 이는 사운드 불일치가 몰입감을 해치기 쉬운 인터랙티브 환경에서 매우 중요합니다.
Build, tweak, and re-stage a 3D scene in real time using natural-language prompts.
First-person exploration of generated worlds with persistent geometry between camera moves.
Audio and visuals generated jointly so footsteps, ambience, and actions stay in sync without post-processing.
Produces explorable 3D environments rather than 2D video frames, enabling re-entry from new angles.
Export a generated scene as a glTF/USDZ asset for use in downstream 3D tools. Only surfaced on the brand hub for now.
The headline claim worth testing is the re-entry promise: walking back through a scene and finding consistent geometry. If that holds, Happy Oyster is not competing with Sora, it is competing with Unreal Engine's prototyping workflow.
Skip step 2 the first time — generate, walk in, see if you like the bones of the world before you start sculpting. Saves 20 minutes when the prompt was wrong anyway.
원하는 장면의 설정, 분위기, 주요 객체 등을 자연어 프롬프트로 작성합니다. Happy Oyster가 디렉팅 모드에서 기본 3D 환경을 생성합니다.
조명, 기하학적 구조, 객체를 실시간으로 수정합니다. 모든 수정 사항이 유지되므로 일회성 출력이 아닌 나만의 고유한 장면이 완성됩니다.
1인칭 시점으로 전환하여 월드를 자유롭게 걷습니다. 카메라 경로를 기록하거나 영상을 내보내고, 다시 재진입하여 반복 수정하세요. 월드의 일관성은 유지됩니다.
| Output type | Interactive 3D world (not pre-rendered video) ✓ |
|---|---|
| Modes | Directing + Wandering ✓ |
| Audio | Natively co-generated with visuals ✓ |
| Access | Public access opened April 2026 ✓ |
| API availability | Public REST API documented ✓ |
| Pricing | $0 free tier, $29/mo Studio ✓ |
| Game-engine export | glTF and USDZ supported ~ |
Scenario: 엔진 에셋을 확정하기 전 플레이 가능한 레벨 레이아웃 프로토타이핑
Outcome: 며칠이 아닌 수 분 만에 반복 작업이 가능하며, 재탐험 가능한 장면 생성
Scenario: 합성된 세트를 통과하는 카메라 움직임 사전 시각화
Outcome: 촬영 전 감독이 장면을 직접 돌아다니며 동선 고정 가능
Scenario: 설치물 및 데모를 위한 분기형 환경 구축
Outcome: 단순 영상 클립이 아닌, 탐색 가능한 세계를 프롬프트 하나로 생성
| vs | On | Happy Oyster | Them |
|---|---|---|---|
| Sora | 출력 패러다임 | 재탐험 가능한 3D 월드 | 선형적인 영상 클립 |
| Runway | 생성 후 사용자 제어 | 실시간으로 직접 연출 및 탐험 | 프롬프트 재입력 및 재생성 |
| Kling | 카메라 자유도 | 자유로운 1인칭 이동 | 생성 시점에 고정된 카메라 경로 |
| Veo | 오디오 | 네이티브 동시 생성 | 별도 생성 또는 부재 |
Quotes gathered from public threads. Not endorsements, just receipts that this is getting real-world use.
Happy Oyster 장면 속에서 40분을 보냈다. 이건 영상 모델이 아니다. 대화가 가능한 게임 엔진에 가깝다.
어제 만든 장면에 다시 들어갔는데 기하학적 구조가 동일했다. 이게 사람들이 아직 잘 모르는 핵심 포인트다.
Happy Oyster 얼리 액세스 첫 체험 — 4:12 부분의 카메라 워크스루를 보면 재진입 일관성이 실제로 어떤 것인지 알 수 있다.
Start with "what is Happy Oyster" if you just got here. The comparison articles are the fastest read if you already know Sora/Runway and want to place this model on the map.
Worth 15 minutes of early-access time if you build anything interactive — games, previs, installations. Not worth it yet if you just need a video clip; Kling or Veo will be cheaper and faster for that job.