وصول فيديوهات Gemini AI.. انطباعات أولية فاترة

وصول فيديوهات Gemini AI.. انطباعات أولية فاترة

دخلت جوجل رسميًا إلى ساحة الفيديو الذي يعمل بالذكاء الاصطناعي، مما جعل نموذج الفيديو Veo 2 AI الخاص بها متاحًا لمشتركي Gemini Advanced.

يمثل هذا الظهور العلني الأول لتقنية فيديو الذكاء الاصطناعي من جوجل، وإن كان ذلك خلف نظام اشتراك مدفوع في بدايته.

يمكن لأولئك المتحمسين لتجربة Veo 2 الاستفادة من نسخة تجريبية مجانية لمدة شهر واحد من اشتراك Google One AI المميز، والذي يتضمن الوصول إلى Gemini Advanced. بعد الفترة التجريبية، يبلغ سعر الاشتراك 20 دولارًا شهريًا. تم دمج Veo 2 أيضًا في مشروع الرسوم المتحركة AI الجديد في Google Labs. تعتزم جوجل توسيع نطاق توفر Veo 2 للمستخدمين المجانيين في المستقبل.

يمثل ظهور فيديو الذكاء الاصطناعي أحدث تطور في الذكاء الاصطناعي التوليدي. يأتي إصدار جوجل الواسع النطاق لـ Veo 2 في أعقاب مبادرات مماثلة من OpenAI (Sora) و Adobe (Firefly). أصبح قطاع خدمات الذكاء الاصطناعي الإبداعية تنافسيًا بشكل متزايد، حيث كشفت شركات التكنولوجيا الكبرى عن نماذج الفيديو الخاصة بها المدعومة بالذكاء الاصطناعي. يشير دخول جوجل إلى زخم متزايد في عروض خدمات فيديو الذكاء الاصطناعي.

تنص سياسة خصوصية Gemini من جوجل على أنها قد تجمع بيانات من تفاعلات المستخدمين، بما في ذلك الدردشات والملفات، وتنصح المستخدمين بعدم مشاركة المعلومات السرية. من خلال الموافقة على سياسة الذكاء الاصطناعي التوليدي من جوجل، يوافق المستخدمون على الالتزام بإرشادات الاستخدام المقبولة للشركة، والتي تهدف إلى منع إنشاء محتوى ضار أو غير قانوني.

يمكن للمستخدمين إنتاج مقاطع AI قصيرة عبر تطبيق Gemini للويب أو الهاتف المحمول عن طريق تحديد Veo 2 من خيارات النموذج داخل واجهة Gemini Advanced. يتم إنشاء مقاطع الفيديو عادةً في غضون دقيقة أو دقيقتين.

تقتصر هذه المقاطع التي تم إنشاؤها بواسطة الذكاء الاصطناعي على ثماني ثوانٍ بدقة 720 بكسل، وتفتقر إلى الصوت. يقوم Gemini تلقائيًا بتقديم مقاطع الفيديو بتنسيق أفقي 16: 9، مع عدم وجود خيارات واضحة للأحجام البديلة، حتى عند تحديدها في المطالبة. علاوة على ذلك، لا يمكن للمستخدمين تحميل صور أو مراجع نمطية، مما يستلزم الكفاءة في هندسة المطالبات AI لتحقيق نتائج الفيديو المرجوة.

هناك قيود على عدد مقاطع الفيديو التي يمكن للمستخدمين إنشاؤها شهريًا، على الرغم من أن القياس الدقيق لهذه الاعتمادات لا يزال غير محدد. تشير جوجل إلى أن المستخدمين سيتلقون تحذيرًا داخل Gemini عندما يقتربون من الحد الأقصى المسموح به.

يتم تضمين علامات SynthID المائية من جوجل تلقائيًا في مقاطع فيديو Veo 2. تعمل هذه العلامات المائية غير المرئية على تحديد المحتوى الذي تم إنشاؤه بالكامل بواسطة الذكاء الاصطناعي. تستخدم جوجل أيضًا هذه التقنية للصور المنتجة باستخدام نموذج Imagen 3 لتحويل النص إلى صورة.

تشير التقييمات الأولية لـ Veo 2 إلى أن مقاطع الفيديو مرضية ولكنها غير ملحوظة. أظهر Gemini التزامًا جديرًا بالثناء بالمطالبات، حيث قام بإنشاء محتوى بدقة مع الحد الأدنى من الأخطاء أو التناقضات. ومع ذلك، تسمح منصات مثل Sora و Firefly بإنشاء مقاطع فيديو AI بدقة أعلى، مثل 1080 بكسل، وتقدم المزيد من خيارات التخصيص الشاملة، والتي تعتبر ضرورية لتقليل تحرير ما بعد الإنتاج. في حين أن جوجل لديها بلا شك خطط لترقيات Veo، إلا أن Veo 2 يعمل حاليًا كأداة مثيرة للاهتمام للتجريب ولكنه من غير المرجح أن يصبح ضروريًا لسير العمل اليومي للمبدعين.

الغوص بشكل أعمق في Veo 2 من Gemini: نظرة عامة شاملة

في حين أن الإصدار الأولي من Veo 2 من جوجل قد يبدو متواضعًا مقارنة بالمنافسين مثل Sora من OpenAI و Firefly من Adobe، فمن الضروري التعمق في تفاصيل قدراته وقيوده وإمكاناته. يعد فهم هذه الفروق الدقيقة أمرًا بالغ الأهمية لأي شخص يفكر في دمج Veo 2 في سير عمله الإبداعي.

الدقة وجودة الإخراج

أحد القيود الأكثر إلحاحًا في Veo 2 هو الحد الأقصى لدقة الإخراج البالغة 720 بكسل. في عصر أصبحت فيه مقاطع الفيديو بدقة 4K قياسية بشكل متزايد، وحتى الأجهزة المحمولة قادرة على التسجيل بدقة عالية، فإن هذا القيد يؤثر بشكل كبير على الجودة المتصورة للمحتوى الذي تم إنشاؤه.في حين أن 720 بكسل قد تكون كافية لمنشورات سريعة على وسائل التواصل الاجتماعي أو الاتصالات الداخلية، إلا أنها لا ترقى إلى مستوى التطبيقات الاحترافية أو المشاريع التي تتطلب دقة بصرية عالية. يتمتع المنافسون مثل Sora، الذي يقدم إخراجًا بدقة 1080 بكسل، بميزة فورية في هذا المجال.

غياب الصوت

يعد عدم وجود صوت في مقاطع الفيديو التي تم إنشاؤها بواسطة Veo 2 عائقًا ملحوظًا آخر. الصوت عنصر حاسم في سرد القصص المرئية، وغيابه يستلزم عملًا إضافيًا بعد الإنتاج لإضافة الموسيقى أو المؤثرات الصوتية أو الحوار. هذا لا يزيد فقط من الوقت والجهد المطلوبين لإنشاء منتج نهائي، ولكنه يحد أيضًا من الإمكانيات الإبداعية داخل عملية توليد الذكاء الاصطناعي نفسها. سيجد المستخدمون الذين يأملون في إنشاء مقاطع فيديو جذابة بسرعة مع صوت متكامل أن Veo 2 يفتقر إلى ذلك في هذا الصدد.

خيارات التخصيص المحدودة

تزيد خيارات التخصيص المحدودة في Veo 2 من تقييد قابليتها للاستخدام. إن عدم القدرة على تحديد نسب العرض إلى الارتفاع بخلاف التنسيق القياسي 16: 9، إلى جانب عدم دعم صور أو مراجع النمط، يجعل من الصعب تكييف الإخراج مع الرؤى الإبداعية المحددة. هذا يجبر المستخدمين على الاعتماد بشكل كبير على المطالبات النصية وحدها، والتي قد يكون من الصعب ضبطها لتحقيق نتائج دقيقة. على النقيض من ذلك، توفر المنصات التي تسمح بالإدخال المرئي والمزيد من التحكم الدقيق في النمط والتكوين ميزة كبيرة.

تحديات هندسة المطالبات

بالنظر إلى القيود المفروضة على التخصيص، تصبح هندسة المطالبات الفعالة ذات أهمية قصوى عند استخدام Veo 2. يجب على المستخدمين تعلم صياغة مطالبات مفصلة ودقيقة لتوجيه الذكاء الاصطناعي نحو النتيجة المرجوة. يتطلب هذا فهمًا عميقًا لكيفية تفسير الذكاء الاصطناعي للغة وترجمتها إلى محتوى مرئي. في حين أن التجريب يمكن أن يساعد المستخدمين على تطوير هذه المهارة، إلا أن منحنى التعلم يمكن أن يكون حادًا، وحتى مهندسي المطالبات ذوي الخبرة قد يكافحون لتحقيق نتائج متسقة. إن عدم وجود تعليقات مرئية أثناء عملية إنشاء المطالبة يزيد من تعقيد الأمور.

حدود الجيل الشهرية

تضيف الحدود غير المعلنة للجيل الشهري طبقة أخرى من عدم اليقين إلى قابلية استخدام Veo 2. بدون معلومات واضحة حول كيفية حساب هذه الحدود، قد يتردد المستخدمون في دمج Veo 2 بالكامل في سير عملهم، خوفًا من نفاد الاعتمادات في لحظة حرجة. هذا النقص في الشفافية يثير القلق بشكل خاص للمستخدمين المحترفين الذين يعتمدون على الوصول المتوقع إلى أدوات الذكاء الاصطناعي.

وعد علامات SynthID المائية

على الرغم من قيوده، يقدم Veo 2 ميزة ملحوظة واحدة: تضمين علامات SynthID المائية. تساعد هذه العلامات المائية غير المرئية على تمييز المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي عن المحتوى الذي أنشأه الإنسان، وهو ما يزداد أهمية في مكافحة المعلومات المضللة والتزييف العميق. في حين أن فعالية SynthID في اكتشاف مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي عبر منصات وعمليات تحرير مختلفة لا تزال غير واضحة، إلا أن تضمينها يشير إلى التزام جوجل بتطوير الذكاء الاصطناعي بشكل مسؤول.

إمكانية النمو في المستقبل

من المهم أن نتذكر أن Veo 2 لا يزال في مراحله الأولى من التطوير. لدى جوجل تاريخ في التحسين التكراري لمنتجات الذكاء الاصطناعي الخاصة بها، ومن المحتمل أن يتلقى Veo 2 تحديثات وتحسينات كبيرة في المستقبل. يمكن أن تشمل التحسينات المحتملة:

  • زيادة دقة الإخراج (1080 بكسل، 4K)
  • تكامل الصوت
  • المزيد من خيارات التخصيص الشاملة (نسب العرض إلى الارتفاع، مراجع النمط)
  • أدوات هندسة المطالبات المحسنة
  • معلومات أوضح حول حدود الجيل
  • تقنية علامات SynthID المائية المحسنة

Veo 2 في السياق الأوسع لتوليد فيديو الذكاء الاصطناعي

لفهم وضع Veo 2 حقًا في السوق، من الضروري مقارنته بمنصات توليد فيديو الذكاء الاصطناعي الرائدة الأخرى. في حين أن لكل منصة نقاط قوتها وضعفها، فإن فهم هذه الاختلافات يمكن أن يساعد المستخدمين على اتخاذ قرارات مستنيرة بشأن الأداة التي تناسب احتياجاتهم على أفضل وجه.

Sora من OpenAI

يمكن القول إن Sora من OpenAI هي منصة توليد فيديو الذكاء الاصطناعي الأكثر إثارة للضجة المتاحة حاليًا. تشمل نقاط قوتها الرئيسية ما يلي:

  • جودة إخراج عالية: Sora قادر على إنشاء مقاطع فيديو بدقة 1080 بكسل بجودة بصرية رائعة.
  • حركة واقعية: تتفوق Sora في إنشاء حركة واقعية وطبيعية المظهر، وهو أمر بالغ الأهمية لإنشاء مشاهد ذات مصداقية.
  • إنشاء مشاهد معقدة: يمكن لـ Sora إنشاء مقاطع فيديو بتفاصيل معقدة وتفاعلات معقدة بين الكائنات والشخصيات.
  • تحويل النص إلى فيديو والصورة إلى فيديو: يدعم Sora كل من مطالبات النص والصورة، مما يوفر للمستخدمين درجة عالية من المرونة.

ومع ذلك، فإن Sora لديها أيضًا قيودها:

  • توفر محدود: Sora متاح حاليًا فقط لمجموعة مختارة من الباحثين والفنانين.
  • تكلفة حسابية عالية: يتطلب إنشاء مقاطع فيديو باستخدام Sora موارد حسابية كبيرة، مما قد يؤدي إلى ارتفاع تكاليف الاستخدام في المستقبل.
  • احتمالية إساءة الاستخدام: تثير القدرة على إنشاء مقاطع فيديو واقعية للغاية تم إنشاؤها بواسطة الذكاء الاصطناعي مخاوف بشأن احتمال إساءة الاستخدام، مثل إنشاء تزييف عميق.

Firefly من Adobe

Firefly من Adobe هو لاعب رئيسي آخر في مجال توليد فيديو الذكاء الاصطناعي. تشمل نقاط قوتها الرئيسية ما يلي:

  • التكامل مع Adobe Creative Suite: تم دمج Firefly بسلاسة مع أدوات Adobe الإبداعية الشائعة، مثل Photoshop و Premiere Pro، مما يسهل على المستخدمين دمج المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي في سير العمل الحالي الخاص بهم.
  • التركيز على الاستخدام التجاري: تستهدف Adobe على وجه التحديد Firefly للمستخدمين التجاريين، وتقدم ميزات مثل ترخيص المحتوى وحماية حقوق الطبع والنشر.
  • مجموعة بيانات تدريب كبيرة: يتم تدريب Firefly على مجموعة بيانات ضخمة من صور Adobe Stock، مما يضمن إخراجًا عالي الجودة ويقلل من خطر إنشاء مواد محمية بحقوق الطبع والنشر.

ومع ذلك، فإن Firefly لديها أيضًا قيودها:

  • قدرات محدودة لتوليد الفيديو: في حين أن Firefly ممتاز في إنشاء الصور والقوام، إلا أن قدراته على توليد الفيديو حاليًا أقل تقدمًا من قدرات Sora.
  • تسعير قائم على الاشتراك: يتطلب الوصول إلى Firefly اشتراكًا في Adobe Creative Cloud، والذي قد يكون مكلفًا بالنسبة لبعض المستخدمين.
  • الاعتماد على نظام Adobe البيئي: قد يجد المستخدمون الذين ليسوا على دراية بالفعل بأدوات Adobe الإبداعية صعوبة في دمج Firefly في سير عملهم.

منصات ناشئة أخرى

بالإضافة إلى Sora و Firefly، يظهر عدد من منصات توليد فيديو الذكاء الاصطناعي الأخرى، ولكل منها ميزاتها وقدراتها الفريدة. تشمل هذه المنصات:

  • RunwayML: تقدم RunwayML مجموعة من أدوات الذكاء الاصطناعي للمحترفين المبدعين، بما في ذلك توليد الفيديو وتحرير الصور ونقل النمط.
  • Synthesia: تركز Synthesia على إنشاء صور رمزية تم إنشاؤها بواسطة الذكاء الاصطناعي ومقدمين افتراضيين لمقاطع الفيديو التدريبية والتسويقية للشركات.
  • Pictory: تتخصص Pictory في تحويل منشورات ومقالات المدونات إلى مقاطع فيديو جذابة لوسائل التواصل الاجتماعي.

مستقبل توليد فيديو الذكاء الاصطناعي

يتطور مجال توليد فيديو الذكاء الاصطناعي بسرعة، ومن المحتمل أن نشهد تطورات كبيرة في السنوات القادمة. تشمل بعض الاتجاهات المستقبلية المحتملة ما يلي:

  • دقة وجودة أعلى: ستستمر منصات توليد فيديو الذكاء الاصطناعي في تحسين دقة وجودة الإخراج البصرية الخاصة بها، لتصل في النهاية إلى النقطة التي يصعب فيها تمييز مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي عن مقاطع الفيديو التي أنشأها الإنسان.
  • حركة وفيزياء أكثر واقعية: سيصبح الذكاء الاصطناعي أفضل في محاكاة الحركة والفيزياء الواقعية، مما يجعل مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي أكثر تصديقًا وغامرة.
  • تحكم وتخصيص محسنان: سيتمتع المستخدمون بمزيد من التحكم في العملية الإبداعية، مع القدرة على تحديد تفاصيل مثل زوايا الكاميرا والإضاءة وعواطف الشخصيات.
  • التكامل مع تقنيات الذكاء الاصطناعي الأخرى: سيتم دمج توليد فيديو الذكاء الاصطناعي مع تقنيات الذكاء الاصطناعي الأخرى، مثل معالجة اللغة الطبيعية ورؤية الكمبيوتر، مما يتيح تطبيقات جديدة ومبتكرة.
  • إضفاء الطابع الديمقراطي على إنشاء الفيديو: سيجعل توليد فيديو الذكاء الاصطناعي من السهل وبأسعار معقولة على أي شخص إنشاء مقاطع فيديو عالية الجودة، بغض النظر عن مهاراتهم الفنية أو ميزانيتهم.

في حين أن Veo 2 من جوجل قد لا يكون منصة توليد فيديو الذكاء الاصطناعي الأكثر إثارة للإعجاب في السوق اليوم، إلا أنه يمثل خطوة مهمة إلى الأمام في إضفاء الطابع الديمقراطي على تقنية الذكاء الاصطناعي. مع استمرار تطور هذا المجال، من المحتمل أن نشهد ظهور أدوات أكثر قوة وسهولة في الوصول إليها، مما يمكّن المبدعين من جميع الأنواع من إحياء رؤاهم.