نفس الفريق
Verifiedكلا النموذجين تم تطويرهما بواسطة قسم ابتكار ATH التابع لشركة Alibaba (مختبر الحياة المستقبلية تحت مجموعة Taotian)
Happy Oyster هو محاكي العالم ثلاثي الأبعاد من Alibaba للبيئات التفاعلية، بينما Happy Horse هو نموذج الفيديو ثنائي الأبعاد الشقيق الذي تصدر لوحات الصدارة العالمية لتوليد النصوص إلى فيديو والصور إلى فيديو.

Key facts
كلا النموذجين تم تطويرهما بواسطة قسم ابتكار ATH التابع لشركة Alibaba (مختبر الحياة المستقبلية تحت مجموعة Taotian)
احتل المرتبة الأولى في Artificial Analysis لتحويل النص إلى فيديو (1,389 Elo) والصورة إلى فيديو (1,416 Elo)
بنية Transfusion مع محول (Transformer) موحد مكون من 40 طبقة، وتخفيف ضجيج الصوت والفيديو المشترك في تمريرة واحدة
ينتج Happy Oyster عوالم ثلاثية الأبعاد تفاعلية؛ بينما ينتج Happy Horse مقاطع فيديو ثنائية الأبعاد
يُعد Happy Oyster و Happy Horse نموذجين شقيقين من نفس فريق Alibaba. فهم علاقتهما هو المفتاح لفهم استراتيجية الذكاء الاصطناعي لدى Alibaba: يهيمن Happy Horse على توليد الفيديو ثنائي الأبعاد، بينما يوسع Happy Oyster تكنولوجيا نفس الفريق لتشمل عوالم ثلاثية الأبعاد تفاعلية.
يأتي كلا النموذجين من فريق مختبر الحياة المستقبلية (Future Life Lab) في مجموعة Taotian التابعة لشركة Alibaba، وهو جزء من قسم ابتكار ATH. يقود الفريق Zhang Di، نائب الرئيس السابق لشركة Kuaishou والرئيس السابق لتكنولوجيا Kling AI. هذا هو نفس الفريق الذي جعل Kling رائدة في السوق قبل الانتقال إلى Alibaba.
ظهر Happy Horse على Artificial Analysis حوالي 7 أبريل 2026 دون الكشف عن مبتكره. وقد ارتقى إلى المرتبة الأولى في كل من تصنيفات تحويل النص إلى فيديو وتحويل الصورة إلى فيديو قبل أن تؤكد Alibaba ملكيتها له في 10 أبريل. تم الإعلان عن Happy Oyster في 16 أبريل 2026 كنموذج مقابل ثلاثي الأبعاد.
| الميزة | Happy Oyster | Happy Horse | |---|---|---| | نوع المخرجات | عوالم ثلاثية الأبعاد تفاعلية | مقاطع فيديو ثنائية الأبعاد | | البعد | ثلاثي الأبعاد (قابل للاستكشاف) | ثنائي الأبعاد (للمشاهدة) | | الأنماط الأساسية | التوجيه + التجوال | تحويل النص إلى فيديو، تحويل الصورة إلى فيديو | | الصوت | توليد مشترك أصلي | توليد صوت وفيديو مشترك في تمريرة واحدة | | البنية | متعدد الوسائط أصلي | Transfusion (محول موحد من 40 طبقة) | | ترتيب التقييم | لا توجد درجات عامة | المركز الأول لتحويل النص إلى فيديو (Elo 1,389)، المركز الأول لتحويل الصورة إلى فيديو (1,416) | | التفاعلية | تكيف المشهد في الوقت الفعلي | تشغيل خطي | | الوصول | وصول مبكر محدود | مخطط لواجهة برمجة التطبيقات (API) في 30 أبريل؛ إصدار مفتوح المصدر قادم | | الاستخدام الأساسي | الألعاب، الواقع الافتراضي، المحاكاة | الأفلام، وسائل التواصل الاجتماعي، التسويق |
يُعد Happy Horse حالياً أفضل نموذج لتوليد الفيديو عالمياً. فقد تفوقت نتيجته في Elo البالغة 1,389 لتحويل النص إلى فيديو على Seedance 2.0 بنحو 115 نقطة. وفي تحويل الصورة إلى فيديو، سجل رقماً قياسياً جديداً بـ Elo بلغ 1,416. هذه ليست صدارات هامشية؛ بل تمثل فجوة كبيرة عن جميع المنافسين.
يستخدم النموذج بنية Transfusion مع محول موحد مكون من 40 طبقة. يتم تخفيف ضجيج رموز النص، ورموز الصور المرجعية، ورموز الفيديو والصوت الصاخبة بشكل مشترك ضمن تسلسل رموز واحد. تستخدم الطبقات الأربع الأولى والأخيرة إسقاطات خاصة بالنمط، بينما تشترك الطبقات الـ 32 الوسطى في المعلمات عبر جميع الأنماط. يقوم النموذج بتوليد الفيديو والصوت معاً في تمريرة واحدة.
ينقل Happy Oyster قدرات فريق ATH إلى الأبعاد الثلاثة. فبدلاً من إنتاج فيديو مسطح تشاهده، فإنه ينشئ عالماً تدخل فيه. يمنح نمط "التوجيه" (Directing) المبدعين تحكماً في بناء المشهد، بينما يسمح نمط "التجوال" (Wandering) بالاستكشاف الحر للبيئات المولدة.
تصف Alibaba الانتقال من التوليد السلبي إلى المحاكاة النشطة بأنه القفزة الكبرى. بالنسبة للتطبيقات التي يحتاج فيها المستخدمون إلى التفاعل مع المحتوى المولد، بما في ذلك النماذج الأولية للألعاب، وتجارب الواقع الافتراضي، والتصور المعماري، ومحاكاة التدريب، فإن العوالم ثلاثية الأبعاد أكثر فائدة بشكل قاطع من مقاطع الفيديو.
هذان النموذجان لا يتنافسان مع بعضهما البعض. بل يمثلان طبقتين من حزمة الذكاء الاصطناعي التوليدي لدى Alibaba:
يمكن لاستوديو ألعاب استخدام Happy Oyster لتوليد بيئات قابلة للاستكشاف واستخدام Happy Horse لإنشاء مقاطع دعائية سينمائية لنفس المشروع. يشير فريق ATH المشترك والتشابهات الهيكلية المحتملة إلى أن تكاملاً أعمق بين النموذجين قد يظهر مع نضجهما.
من المقرر إطلاق واجهة برمجة التطبيقات (API) لـ Happy Horse في 30 أبريل 2026، مع إصدار مفتوح المصدر بالكامل لاحقاً. بينما يوجد Happy Oyster حالياً في مرحلة وصول مبكر محدودة دون جدول زمني لإصدار واجهة برمجة تطبيقات عامة. إذا كنت بحاجة إلى البدء في إنشاء المحتوى الآن، فإن Happy Horse هو الخيار الأقرب.
لتقييم كلا النموذجين كجزء من سير عمل أوسع للذكاء الاصطناعي، توفر Elser.ai أدوات مقارنة عبر منصات الفيديو والمنصات ثلاثية الأبعاد. اقرأ ما هو Happy Oyster؟ للحصول على شرح كامل للنموذج ثلاثي الأبعاد، أو شاهد كيف يقارن بأقرب منافس خارجي له، HY-World 2.0.
Mixed signal
معايير تقييم Happy Horse تم التحقق منها. Happy Oyster في مرحلة الوصول المبكر مع بيانات عامة محدودة. كلاهما يأتي من نفس فريق Alibaba ATH.
Readers should expect careful wording here because public reporting confirms the topic, while some product details still need cautious treatment.
أداة موصى بها
تخطَ الانتظار — جرب إنشاء فيديوهات الذكاء الاصطناعي الآن باستخدام أداة متاحة اليوم.
مدعوم من Elser.ai — يعمل بشكل مستقل عن أي نموذج تمت مناقشته أعلاه.
جرب محرك الصور بالذكاء الاصطناعياحصل على أكثر من 50 أمراً تجريبياً لفيديوهات الذكاء الاصطناعي، وجداول مقارنة، وقوالب سير عمل يتم إرسالها إلى صندوق بريدك.
FAQ
نعم. كلاهما تم تطويرهما بواسطة قسم ابتكار ATH التابع لشركة Alibaba، وتحديداً فريق مختبر الحياة المستقبلية تحت مجموعة Taotian، بقيادة Zhang Di.
يخدم كلاهما أغراضاً مختلفة. Happy Horse مخصص لإنشاء محتوى الفيديو، بينما Happy Oyster مخصص للبيئات التفاعلية ثلاثية الأبعاد. اختر بناءً على حاجتك للفيديو أو للعوالم ثلاثية الأبعاد.
من المخطط توفير الوصول إلى واجهة برمجة التطبيقات (API) لـ Happy Horse في 30 أبريل 2026، مع إصدار مفتوح المصدر بالكامل يتضمن GitHub وأوزان النموذج لاحقاً.
من المحتمل. يمكن لـ Happy Horse توليد فيديو تسويقي لمنتج تم بناؤه باستخدام بيئات Happy Oyster ثلاثية الأبعاد. قد تتيح بنية ATH المشتركة تكاملاً أقوى بمرور الوقت.