النوع
Mixedنموذج موحد متعدد الوسائط يتعامل مع النص والصورة والفيديو والصوت في مسار واحد
Gemini Omni هو نموذج جوجل الموحد متعدد الوسائط الذي ظهر من خلال تسريبات واجهة مستخدم تطبيق Gemini. من المتوقع أن يقوم بتوليد النص والصور والفيديو والصوت بشكل أصلي في مسار واحد، وأن يتم الكشف عنه في مؤتمر Google I/O 2026 في 19 مايو 2026.

Key facts
نموذج موحد متعدد الوسائط يتعامل مع النص والصورة والفيديو والصوت في مسار واحد
ظهر من خلال نصوص واجهة مستخدم تطبيق Gemini قبل مؤتمر Google I/O 2026
الكلمة الرئيسية في مؤتمر Google I/O 2026 يوم 19 مايو 2026
قد يحل محل أو يكمل مسار فيديو Veo 3.1؛ وقد يتشارك في حزمة الاستنتاج مع Veo 4
Mixed signal
لم تقم جوجل بتأكيد Gemini Omni رسمياً حتى تاريخ 18 مايو 2026. تم الحصول على القدرات من تسريبات واجهة مستخدم تطبيق Gemini والتقارير الموثوقة. تعامل مع التفاصيل كتوقعات حتى موعد مؤتمر I/O 2026.
Readers should expect careful wording here because public reporting confirms the topic, while some product details still need cautious treatment.
Gemini Omni هو نموذج الذكاء الاصطناعي الموحد متعدد الوسائط من جوجل الذي تم تسريبه، وظهر من خلال نصوص واجهة المستخدم داخل تطبيق Gemini ومن خلال تقارير الصناعة في الفترة التي تسبق مؤتمر Google I/O 2026. اعتباراً من 18 مايو 2026، لم تعلن جوجل رسمياً عن Omni، لكن مجموعة من الإشارات المنسقة تشير إلى الكشف عنه خلال الكلمة الرئيسية في 19 مايو.
عبر المصادر المتاحة، يتم وصف Omni بثلاث طرق متداخلة:
ما يوحد هذه الأوصاف هو تموضع النموذج داخل تطبيق Gemini، بدلاً من كونه منتج Veo منفصل. يشير هذا التموضع إلى أن جوجل تريد من Omni خدمة سير عمل المبدعين المستهلكين بدلاً من عملاء Vertex AI للمؤسسات في الموجة الأولى.
اليوم، توليد أصل متعدد الوسائط يعني عادة تنسيق نماذج متعددة: واحد للنص، وآخر للصور، وآخر للفيديو، وآخر للصوت. كل عملية تسليم تفقد السياق. يتيح نموذج "Omni" الموحد حقاً لمحادثة واحدة إنتاج فقرة، ورسم توضيحي مطابق، ومقطع فيديو قصير، وتعليق صوتي تشير جميعها إلى نفس المفهوم المشترك.
الآثار العملية:
إذا نجح Omni في تقديم الهندسة الموحدة، فسيغير ذلك كيفية قيام المبدعين بربط التخطيط القصصي وكتابة السيناريو وتوليد الفيديو. الأدوات التي تنسق عبر مزودين مختلفين، بما في ذلك Elser.ai، مهيأة لإظهار هذه القدرة عبر واجهات خلفية متعددة مع وصولها.
حتى لو وصل Gemini Omni كأكثر النماذج الموحدة قدرة في السوق، فإنه يظل مولد محتوى ثنائي الأبعاد (2D). المخرجات هي فيديو وصور وصوت؛ ويشاهدها المشاهدون أو يستمعون إليها بشكل خطي.
أما Happy Oyster، الذي أطلقته شركة Alibaba's ATH Innovation Division في 16 أبريل 2026، فهو محاكي عالم ثلاثي الأبعاد (3D). إنه يولد بيئات تفاعلية ثلاثية الأبعاد قابلة للاستكشاف مع أوضاع التوجيه والتجوال. المخرجات هي شيء تتحرك من خلاله، وليس شيئاً تشاهده فقط.
بالنسبة لمعظم المبدعين، الخيار ليس "Omni أم Happy Oyster". بل هو "ما هي فئة المحتوى التي يحتاجها مشروعي؟" إذا كنت بحاجة إلى مقاطع سينمائية، اختر أقوى نموذج فيديو. إذا كنت بحاجة إلى عوالم تفاعلية، اختر نموذج عالم ثلاثي الأبعاد. راجع Happy Oyster vs Gemini Omni لمقارنة ميزة بميزة.
الأسئلة التي يجب الإجابة عليها في 19 مايو 2026:
للمتابعة المستمرة، راجع Gemini Omni release date وتحليل Veo 4 vs Gemini Omni.
أداة موصى بها
استخدم أداة فيديو ذكاء اصطناعي متاحة للجمهور بينما تظل التفاصيل الرسمية محدودة أو غير مؤكدة.
مشغل بواسطة Elser.ai — لا يعتمد على وصول رسمي غير مؤكد.
جرب محرك الرسوم المتحركة بالذكاء الاصطناعيFAQ
ليس رسمياً. تم اكتشاف Gemini Omni كنص في واجهة المستخدم داخل تطبيق Gemini ومن خلال إشارات داخلية. تشير التقارير باستمرار إلى كشف في مؤتمر Google I/O 2026 في 19 مايو، لكن جوجل لم تؤكد الاسم أو النموذج.
تم وضع Veo 4 كنموذج فيديو متخصص تالٍ. أما Gemini Omni فهو نظام موحد متعدد الوسائط يتعامل مع النص والصورة والفيديو والصوت داخل نموذج واحد. قد يتم إطلاقهما معاً: Veo 4 كمسار فيديو متخصص عالي الجودة، وGemini Omni كتجربة متعددة الوسائط داخل تطبيق Gemini.
النموذج الموحد متعدد الوسائط يمثل النصوص والصور والفيديو والصوت في مساحة تضمين مشتركة واحدة ويولد عبر الوسائط دون الحاجة إلى تسليمها لنماذج متخصصة منفصلة. كان أول مثال واسع الانتشار هو GPT-4o من OpenAI؛ وسيكون Gemini Omni الخطوة المقابلة من جوجل لوسائط الإخراج الكاملة.
التقارير منقسمة. تصف بعض المصادر Omni كبديل لمسار Veo 3.1. بينما تصفه مصادر أخرى بأنه شقيق يتشارك في البنية التحتية ولكنه يستهدف واجهات مختلفة. العلاقة بينهما هي إحدى الأسئلة المفتوحة لمؤتمر I/O 2026.
احصل على أكثر من 50 أمر فيديو ذكاء اصطناعي مجرب، وأوراق غش للمقارنة، وقوالب سير عمل تصل إلى بريدك الوارد.