كيفية الاستفادة من «Gemini Omni» في إنتاج الفيديوهات باستخدام الذكاء الاصطناعي

أعلنت شركة جوجل عن إطلاق نموذجها الجديد للذكاء الاصطناعي "Gemini Omni"، في خطوة جديدة تعزز قدرات منظومة Gemini في مجال إنتاج المحتوى المرئي التفاعلي، حيث يتيح النموذج إنشاء وتحرير مقاطع الفيديو اعتمادًا على مدخلات متعددة تشمل النصوص والصور والصوت.

وقالت الشركة إن النموذج يمثل تطورًا مهمًا في تقنيات الذكاء الاصطناعي التوليدي متعدد الوسائط، إذ يجمع بين قدرات الفهم والاستدلال السياقي لنماذج Gemini، وبين إمكانيات إنتاج فيديوهات إبداعية يمكن التحكم بها بشكل مباشر عبر الأوامر النصية.

ويعتمد "Gemini Omni" على نظام تفاعلي يسمح للمستخدمين بإجراء تعديلات على الفيديوهات من خلال المحادثة فقط، دون الحاجة إلى أدوات مونتاج تقليدية، حيث يمكن تغيير المشاهد أو تعديل العناصر أو إعادة بناء القصة بالكامل باستخدام اللغة الطبيعية.

وأكدت جوجل أن النموذج يتميز بالحفاظ على الاتساق البصري للشخصيات والعناصر داخل المشاهد حتى مع التعديلات المتكررة، إضافة إلى قدرته على تنفيذ تغييرات معقدة تشمل البيئة والحركة وإضافة شخصيات جديدة أو إعادة تصور السيناريوهات.

كما أوضحت الشركة أن النموذج يدعم دمج مدخلات متعددة مثل الصور والرسومات والمقاطع الصوتية ومقاطع الفيديو المرجعية داخل مشهد واحد متكامل،.....

لقراءة المقال بالكامل، يرجى الضغط على زر "إقرأ على الموقع الرسمي" أدناه


هذا المحتوى مقدم من موقع مبتدا

إقرأ على الموقع الرسمي


المزيد من موقع مبتدا

منذ 6 ساعات
منذ 5 ساعات
منذ 7 ساعات
منذ ساعتين
منذ ساعتين
منذ ساعتين
صحيفة المصري اليوم منذ ساعتين
مصراوي منذ 5 ساعات
موقع صدى البلد منذ 18 ساعة
موقع صدى البلد منذ 20 ساعة
موقع صدى البلد منذ 15 ساعة
صحيفة اليوم السابع منذ 4 ساعات
صحيفة المصري اليوم منذ 12 ساعة
مصراوي منذ 7 ساعات