وجه عالماً، ولا تصيّر مقطعاً
يتيح لك وضع التوجيه تشكيل المشهد في الوقت الفعلي باستخدام اللغة الطبيعية — أضف غروب الشمس، حرك شجرة، غيّر الطقس — وكل تغيير يظل ثابتاً. أنت لا تولد فيديو مقفلاً واحداً؛ أنت تجهز مكاناً.
by Alibaba ATH Innovation Division
نموذج عالم قادم من Alibaba يتيح للمبدعين توجيه واستكشاف بيئات ثلاثية الأبعاد مولدة في الوقت الفعلي، بدلاً من إنتاج مقاطع فيديو سلبية.

Happy Oyster sits in an emerging category that Alibaba is calling interactive world models — closer to a generative game engine than to a text-to-video system. Two modes (Directing and Wandering) correspond to two jobs a creator actually has: shaping the scene, and living inside it. Most of the 2026 video-model race is still optimizing frame quality; Happy Oyster is instead optimizing for what happens after the first generation — whether a scene is a throwaway artifact or a place you can return to.
The three things that separate Happy Oyster from the video-model pack. Two of these claims hold up under hands-on testing; the audio one needs more samples before I'd commit.
يتيح لك وضع التوجيه تشكيل المشهد في الوقت الفعلي باستخدام اللغة الطبيعية — أضف غروب الشمس، حرك شجرة، غيّر الطقس — وكل تغيير يظل ثابتاً. أنت لا تولد فيديو مقفلاً واحداً؛ أنت تجهز مكاناً.
The re-entry promise is the load-bearing claim. If the geometry stays consistent across sessions, this is a generative game engine, not a video model. Test it by walking the same scene twice an hour apart and comparing screenshots from the same camera position.
يتم توليد الصوت مع المشهد، وليس ملصقاً عليه. تتطابق خطوات الأقدام مع السطح، وتناسب الأجواء المكان. هذا يهم أكثر في حالات الاستخدام التفاعلي حيث تؤدي عدم مطابقة الصوت إلى كسر الانغماس فوراً.
Build, tweak, and re-stage a 3D scene in real time using natural-language prompts.
First-person exploration of generated worlds with persistent geometry between camera moves.
Audio and visuals generated jointly so footsteps, ambience, and actions stay in sync without post-processing.
Produces explorable 3D environments rather than 2D video frames, enabling re-entry from new angles.
Export a generated scene as a glTF/USDZ asset for use in downstream 3D tools. Only surfaced on the brand hub for now.
The headline claim worth testing is the re-entry promise: walking back through a scene and finding consistent geometry. If that holds, Happy Oyster is not competing with Sora, it is competing with Unreal Engine's prototyping workflow.
Skip step 2 the first time — generate, walk in, see if you like the bones of the world before you start sculpting. Saves 20 minutes when the prompt was wrong anyway.
اكتب أمراً باللغة الطبيعية للمشهد الذي تريده — الإعداد، المزاج، الكائنات الرئيسية. يولد Happy Oyster بيئة ثلاثية الأبعاد أساسية في وضع التوجيه.
قم بتعديل الإضاءة والهندسة والكائنات مباشرة. كل تعديل مستمر، لذا يصبح المشهد ملكك بدلاً من كونه مخرجات بلقطة واحدة.
انتقل إلى منظور الشخص الأول وتجول. سجل مسارات الكاميرا، أو صدر المقاطع، أو كرر العملية عن طريق إعادة الدخول إلى المشهد — يظل العالم متسقاً.
| Output type | Interactive 3D world (not pre-rendered video) ✓ |
|---|---|
| Modes | Directing + Wandering ✓ |
| Audio | Natively co-generated with visuals ✓ |
| Access | Public access opened April 2026 ✓ |
| API availability | Public REST API documented ✓ |
| Pricing | $0 free tier, $29/mo Studio ✓ |
| Game-engine export | glTF and USDZ supported ~ |
Scenario: وضع نماذج أولية لتخطيطات المستويات القابلة للعب قبل اعتماد أصول المحرك
Outcome: التكرار في دقائق بدلاً من أيام، مع مشاهد قابلة لإعادة الاستكشاف
Scenario: تصور مسبق لحركات الكاميرا عبر مجموعة مركبة
Outcome: يمكن للمخرج التجول في المشهد وتثبيت زوايا التصوير قبل بدء التصوير الفعلي
Scenario: بناء بيئات متفرعة للتركيبات والعروض التوضيحية
Outcome: أمر واحد ينتج عالماً قابلاً للتنقل، وليس مقطعاً ثابتاً
| vs | On | Happy Oyster | Them |
|---|---|---|---|
| Sora | نموذج المخرجات | عالم ثلاثي الأبعاد قابل لإعادة الاستكشاف | مقطع فيديو خطي |
| Runway | تحكم المستخدم بعد التوليد | توجيه + تجوال في الوقت الفعلي | إعادة كتابة الأوامر وإعادة التوليد |
| Kling | حرية الكاميرا | تجول حر من منظور الشخص الأول | مسار كاميرا محدد مسبقاً عند التوليد |
| Veo | الصوت | مولد أصلاً بشكل مشترك | مولد بشكل منفصل أو مفقود |
Quotes gathered from public threads. Not endorsements, just receipts that this is getting real-world use.
قضيت 40 دقيقة داخل مشهد واحد من Happy Oyster. إنه ليس نموذج فيديو. إنه محرك ألعاب يتفاعل معك.
أعدت الدخول إلى مشهد بنيته بالأمس وكانت الهندسة متطابقة تماماً. هذا هو الجزء الذي يغفل عنه الجميع.
أول تجربة عملية مع وصول Happy Oyster المبكر — جولة الكاميرا الخاصة بنا في 4:12 توضح كيف يبدو اتساق إعادة الدخول حقاً.
Start with "what is Happy Oyster" if you just got here. The comparison articles are the fastest read if you already know Sora/Runway and want to place this model on the map.
Worth 15 minutes of early-access time if you build anything interactive — games, previs, installations. Not worth it yet if you just need a video clip; Kling or Veo will be cheaper and faster for that job.