قدرات جديدة في Gemini: استعلامات الفيديو والشاشة

تفاعل الشاشة في الوقت الفعلي: ‘Screenshare’

تم عرض ميزة ‘Screenshare’ في المؤتمر العالمي للجوال (MWC) 2025 في برشلونة، وهي تمثل قفزة في الفهم السياقي لـ Gemini. تتيح هذه الوظيفة للمستخدمين مشاركة محتوى شاشة هواتفهم مباشرةً مع مساعد الذكاء الاصطناعي، مما يتيح مستوى جديدًا من الاستعلام التفاعلي.

تخيل أنك تتصفح متجرًا عبر الإنترنت، وتبحث عن زوج مثالي من الجينز الفضفاض. باستخدام Screenshare، يمكنك ببساطة مشاركة شاشتك مع Gemini والاستعلام عن عناصر الملابس التكميلية. يمكن لـ Gemini، بفهمه المحسن للسياق المرئي، تقديم اقتراحات ذات صلة، مما يجعل تجربة التسوق الخاصة بك أكثر سهولة وكفاءة.

تتجاوز هذه الميزة التعرف البسيط على الصور. يتعلق الأمر بفهم سياق المستخدم الحالي وتقديم المعلومات التي تتعلق مباشرة بنشاطه الفوري. سواء كنت تقارن مواصفات المنتج، أو تسعى للحصول على توضيح بشأن رسم تخطيطي معقد، أو حتى تتنقل في تطبيق غير مألوف، فإن Screenshare تقدم أداة قوية للمساعدة الفورية والمراعية للسياق.

البحث في الفيديو: الكشف عن الرؤى المتحركة

تمت معاينة ميزة البحث في الفيديو لأول مرة في Google I/O العام الماضي، وهي تنقل قدرات Gemini إلى ما هو أبعد من الصور الثابتة. تُمكّن هذه الوظيفة المستخدمين من تسجيل مقطع فيديو وطرح أسئلة على Gemini حول المحتوى أثناء تصويره.

هذا يفتح عالماً من الاحتمالات. تخيل أنك في متحف، مفتونًا بقطعة فنية. يمكنك تصوير العمل الفني وسؤال Gemini عن أهميته التاريخية، أو تقنيات الفنان، أو حتى الرمزية داخل القطعة. يمكن لـ Gemini، الذي يحلل الفيديو في الوقت الفعلي، تقديم رؤى فورية، مما يثري فهمك وتقديرك.

ضع في اعتبارك إمكانية التطبيقات التعليمية. يمكن للطلاب تصوير تجربة علمية وسؤال Gemini عن المبادئ الأساسية التي تلعب دورًا. يمكن للميكانيكيين تسجيل إصلاح معقد للمحرك وتلقي إرشادات في الوقت الفعلي من Gemini. الاحتمالات واسعة وتمتد عبر العديد من المجالات.

توسيع حدود التفاعل مع الذكاء الاصطناعي

هذه الميزات الجديدة لا تتعلق فقط بطرح الأسئلة؛ إنها تتعلق بإنشاء تفاعل أكثر مرونة وطبيعية بين المستخدمين والمعلومات. غالبًا ما تتطلب طرق البحث التقليدية من المستخدمين صياغة استعلامات نصية دقيقة. من خلال الاستعلام المستند إلى الفيديو والشاشة، يسمح Gemini بنهج أكثر سهولة، ويعكس الطريقة التي نستكشف بها ونتعلم بها بشكل طبيعي في العالم الحقيقي.

يمثل التحرك نحو الفهم البصري والسياقي اتجاهًا مهمًا في تطوير الذكاء الاصطناعي. مع ازدياد تطور نماذج الذكاء الاصطناعي، أصبحت قادرة بشكل متزايد على تفسير المعلومات غير النصية والاستجابة لها، مما يفتح آفاقًا جديدة للتفاعل بين الإنسان والحاسوب.

تعمق أكثر في وظائف Screenshare

ميزة Screenshare هي أكثر من مجرد أداة بسيطة لمشاركة الشاشة. إنه نظام متطور يجمع بين العديد من قدرات الذكاء الاصطناعي لتوفير تجربة مستخدم سلسة وبديهية.

  • التحليل البصري في الوقت الفعلي: لا يرى Gemini الشاشة فحسب؛ بل يحلل المحتوى في الوقت الفعلي. هذا يعني أنه يمكنه تحديد الكائنات والنصوص وحتى السياق العام لما يتم عرضه. يسمح هذا التحليل المستمر لـ Gemini بالاستجابة للأسئلة بسرعة ودقة.
  • الفهم السياقي: يتجاوز Gemini مجرد تحديد العناصر على الشاشة. إنه يفهم سياق نشاط المستخدم. على سبيل المثال، إذا كنت تتصفح موقعًا للتسوق، فسيفهم Gemini أنك تبحث على الأرجح عن معلومات المنتج أو توصيات. يسمح هذا الوعي السياقي لـ Gemini بتقديم إجابات أكثر صلة وفائدة.
  • معالجة اللغة الطبيعية: في حين أن الإدخال مرئي، يظل التفاعل طبيعيًا وبديهيًا. يمكن للمستخدمين طرح الأسئلة بلغة بسيطة، تمامًا كما يفعلون مع مساعد بشري. تسمح قدرات معالجة اللغة الطبيعية لـ Gemini بفهم القصد من وراء السؤال وتقديم استجابة ذات صلة.
  • التعلم التكيفي: يتعلم Gemini من كل تفاعل. عندما يطرح المستخدمون المزيد من الأسئلة ويقدمون ملاحظات، يتحسن فهم Gemini لتفضيلاتهم واحتياجاتهم. يسمح هذا التعلم التكيفي لـ Gemini بتقديم مساعدة مخصصة ومفيدة بشكل متزايد بمرور الوقت.

استكشاف إمكانات البحث في الفيديو

تمثل ميزة البحث في الفيديو تقدمًا كبيرًا في استرجاع المعلومات المدعوم بالذكاء الاصطناعي. لا يتعلق الأمر فقط بالعثور على مقاطع الفيديو؛ بل يتعلق باستخراج المعرفة والرؤى من داخل مقاطع الفيديو.

  • تحليل المحتوى الديناميكي: على عكس الصور الثابتة، تحتوي مقاطع الفيديو على ثروة من المعلومات الديناميكية. يمكن لـ Gemini تحليل الحركة، وتحديد التغييرات بمرور الوقت، وفهم العلاقات بين العناصر المختلفة داخل الفيديو. يسمح هذا بفهم أكثر ثراءً ودقة للمحتوى.
  • الإجابة على الأسئلة في الوقت الفعلي: تعد القدرة على طرح الأسئلة أثناء التصوير بمثابة تغيير لقواعد اللعبة. هذا يلغي الحاجة إلى تذكر تفاصيل محددة أو صياغة استعلامات معقدة بعد وقوع الحدث. يمكن للمستخدمين ببساطة توجيه الكاميرا الخاصة بهم إلى شيء مثير للاهتمام وسؤال Gemini للحصول على معلومات فورية.
  • التعلم متعدد الوسائط: يجمع البحث في الفيديو بين المعلومات المرئية والإشارات الصوتية (إن وجدت) والفهم السياقي. يسمح هذا النهج متعدد الوسائط لـ Gemini بالاعتماد على مصادر متعددة للمعلومات لتقديم إجابات شاملة.
  • إمكانية الوصول المحسنة: يمكن أن يكون البحث في الفيديو مفيدًا بشكل خاص للأفراد الذين يعانون من إعاقات بصرية. من خلال السماح للمستخدمين بطرح أسئلة حول محيطهم، يمكن لـ Gemini مساعدتهم على التنقل في العالم بسهولة أكبر والوصول إلى المعلومات التي قد يتعذر الوصول إليها.

مستقبل المساعدة المدعومة بالذكاء الاصطناعي

يعد إدخال الاستعلامات المستندة إلى الفيديو والشاشة في Gemini لمحة عن مستقبل المساعدة المدعومة بالذكاء الاصطناعي. مع استمرار تطور نماذج الذكاء الاصطناعي، يمكننا أن نتوقع تفاعلات أكثر سلاسة وبديهية بين البشر والتكنولوجيا.

  • التعلم المخصص: ستصبح مساعدات الذكاء الاصطناعي بارعة بشكل متزايد في فهم أساليب وتفضيلات التعلم الفردية. سيكونون قادرين على تكييف المحتوى التعليمي وتقديم إرشادات مخصصة لمساعدة المستخدمين على تحقيق أهدافهم التعليمية.
  • تكامل الواقع المعزز: يعد البحث في الفيديو والاستعلامات المستندة إلى الشاشة مناسبًا بشكل طبيعي لتطبيقات الواقع المعزز (AR). تخيل ارتداء نظارات الواقع المعزز التي يمكنها تحديد الكائنات في مجال رؤيتك وتقديم معلومات في الوقت الفعلي عنها.
  • المساعدة الاستباقية: ستصبح مساعدات الذكاء الاصطناعي أكثر استباقية في توقع احتياجات المستخدم. سيكونون قادرين على تحديد المشاكل أو الفرص المحتملة وتقديم المساعدة قبل أن يُطلب منهم ذلك صراحةً.
  • التعاون المحسن: ستسهل مساعدات الذكاء الاصطناعي التعاون الأكثر فعالية بين البشر. سيكونون قادرين على ترجمة اللغات في الوقت الفعلي، وتلخيص النقاط الرئيسية من الاجتماعات، وحتى تقديم رؤى حول ديناميكيات الفريق.

التوفر والإطلاق

من المقرر إطلاق هذه الميزات الرائدة لمستخدمي Gemini Advanced في خطة Google One AI Premium على Android في وقت لاحق من هذا الشهر. يسمح هذا الإطلاق المرحلي لـ Google بجمع تعليقات المستخدمين وتحسين الميزات بشكل أكبر قبل إصدار أوسع. تقدم خطة Google One AI Premium مجموعة من المزايا، بما في ذلك الوصول إلى نماذج وميزات الذكاء الاصطناعي الأكثر تقدمًا، مما يجعلها خيارًا مقنعًا للمستخدمين الذين يسعون إلى استكشاف أحدث تقنيات الذكاء الاصطناعي.
يعكس هذا التوفر الأولي على Android اعتماد النظام الأساسي على نطاق واسع ويوفر قاعدة مستخدمين كبيرة للاختبار والتحسين. من المحتمل التوسع المستقبلي إلى منصات أخرى، حيث تواصل Google تطوير وتحسين قدرات Gemini عبر نظامها البيئي.

تركيز أعمق على التطبيقات العملية

تكمن القوة الحقيقية لميزات Gemini الجديدة هذه في تطبيقاتها العملية عبر مجموعة واسعة من السيناريوهات. دعونا نفكر في بعض الأمثلة المحددة:

1. السفر والاستكشاف:

  • تحديد المعالم: أثناء زيارة مدينة جديدة، يمكن للمستخدم تصوير مبنى تاريخي وسؤال Gemini عن اسمه وتاريخه وأهميته المعمارية.
  • ترجمة القائمة: في مطعم أجنبي، يمكن للمستخدم مشاركة شاشته التي تعرض القائمة مع Gemini وتلقي ترجمة فورية، إلى جانب توصيات بناءً على تفضيلاتهم الغذائية.
  • التنقل في وسائل النقل العام: أثناء التنقل في نظام مترو أنفاق غير مألوف، يمكن للمستخدم تصوير الخريطة وسؤال Gemini عن أفضل طريق إلى وجهته.

2. التعليم والتعلم:

  • الكتب المدرسية التفاعلية: يمكن للطلاب مشاركة شاشتهم التي تعرض صفحة من كتاب مدرسي مع Gemini وطرح أسئلة حول المفاهيم أو التعريفات المعقدة.
  • المساعدة في التجارب العلمية: أثناء إجراء تجربة علمية، يمكن للطالب تصوير العملية وسؤال Gemini عن النتائج المتوقعة أو مخاطر السلامة المحتملة.
  • تعلم اللغة: يمكن لمتعلمي اللغة تصوير محادثة أو مقطع فيديو بلغة أجنبية وسؤال Gemini عن الترجمات أو التفسيرات النحوية أو إرشادات النطق.

3. التسوق والتجارة:

  • مقارنة المنتجات: أثناء التسوق عبر الإنترنت، يمكن للمستخدم مشاركة شاشته التي تعرض صفحات منتجات متعددة مع Gemini وطلب مقارنة بين الميزات والأسعار ومراجعات العملاء.
  • نصائح الأناقة: كما هو موضح في المثال الأولي، يمكن للمستخدمين طلب المشورة بشأن الموضة من خلال مشاركة شاشتهم التي تعرض عناصر الملابس وسؤال Gemini عن القطع التكميلية أو اقتراحات الملابس.
  • المساعدة في الوصفات: أثناء اتباع وصفة عبر الإنترنت، يمكن للمستخدم مشاركة شاشته مع Gemini وطلب بدائل للمكونات أو توضيح تقنيات الطهي.

4. الدعم الفني واستكشاف الأخطاء وإصلاحها:

  • تشخيص مشكلات البرامج: أثناء مواجهة مشكلة في البرنامج، يمكن للمستخدم مشاركة شاشته مع Gemini وتلقي إرشادات تفصيلية خطوة بخطوة لاستكشاف الأخطاء وإصلاحها.
  • المساعدة في إصلاح الأجهزة: أثناء محاولة إصلاح جهاز، يمكن للمستخدم تصوير العملية وسؤال Gemini عن تحديد المكونات أو تعليمات حول خطوات إصلاح محددة.
  • استكشاف مشكلات اتصال الشبكة وإصلاحها: أثناء مواجهة مشكلات في اتصال الشبكة، يمكن للمستخدم مشاركة شاشته التي تعرض إعدادات الشبكة مع Gemini وتلقي المساعدة في تشخيص المشكلة وحلها.

هذه مجرد أمثلة قليلة، والتطبيقات المحتملة لا حدود لها تقريبًا. مع زيادة إلمام المستخدمين بهذه الميزات، سيكتشفون بلا شك طرقًا جديدة ومبتكرة للاستفادة من قدرات Gemini في حياتهم اليومية. المفتاح هو التحول من الاستعلامات النصية إلى شكل أكثر طبيعية وبديهية للتفاعل، مما يسمح للمستخدمين بالوصول إلى المعلومات والمساعدة بطريقة تتكامل بسلاسة مع أنشطتهم في العالم الحقيقي.