روبوت جوجل الجديد: ذكاء اصطناعي بارع

السعي نحو الذكاء الاصطناعي المتجسد: هدف طموح

لسنوات، سعى قطاع الروبوتات إلى تحقيق الهدف المراوغ المتمثل في “الذكاء الاصطناعي المتجسد” – وهو إنشاء ذكاء اصطناعي قادر على التحكم الذاتي في الروبوتات من خلال مجموعة واسعة من السيناريوهات الجديدة وغير المتوقعة، كل ذلك مع الحفاظ على السلامة والدقة. هذا الطموح، الذي تسعى إليه شركات مثل Nvidia بنشاط، يظل “الكأس المقدسة” مع إمكانية تحويل الروبوتات إلى عمال متعددي الاستخدامات قادرين على أداء مجموعة واسعة من المهام في العالم الحقيقي.

Gemini Robotics: البناء على أساس اللغة والرؤية

تستفيد نماذج جوجل الجديدة من قوة نموذج اللغة الكبير Gemini 2.0، مما يوسع قدراته لتشمل المتطلبات المحددة لتطبيقات الروبوتات. يشتمل Gemini Robotics على ما تسميه جوجل قدرات “الرؤية واللغة والعمل” (VLA). يسمح هذا للنموذج بمعالجة المدخلات المرئية، وتفسير أوامر اللغة الطبيعية، وترجمة هذه المدخلات إلى حركات جسدية دقيقة. في المقابل، يركز Gemini Robotics-ER على “الاستدلال المتجسد”، ويتميز بفهم مكاني محسّن يتيح التكامل السلس مع أنظمة التحكم في الروبوت الحالية.

من الفهم إلى العمل: حقبة جديدة من البراعة

الآثار العملية لهذه التطورات عميقة. تخيل أنك تطلب من روبوت مزود بـ Gemini Robotics أن “يلتقط الموزة ويضعها في السلة”. سيقوم الروبوت، باستخدام رؤيته القائمة على الكاميرا، بتحديد الموزة وتوجيه ذراعه الآلية بمهارة لتنفيذ المهمة. أو فكر في الأمر، “اطوِ ثعلبًا من الأوريجامي”. سيقوم الروبوت، بالاعتماد على معرفته بالأوريجامي وفن طي الورق الدقيق، بأداء المهمة المعقدة بدقة.

في عام 2023، شكل نموذج RT-2 من جوجل خطوة مهمة نحو قدرات الروبوتات المعممة. من خلال الاستفادة من بيانات الإنترنت، مكّن RT-2 الروبوتات من فهم أوامر اللغة والتكيف مع المواقف الجديدة، مما ضاعف الأداء في المهام غير المرئية مقارنة بسابقه. بعد عامين، يبدو أن Gemini Robotics قد حقق قفزة كبيرة أخرى، متجاوزًا مجرد الفهم ليشمل تنفيذ عمليات التلاعب الجسدي المعقدة التي كانت تتجاوز صراحةً نطاق RT-2.

بينما كان RT-2 مقصورًا على إعادة استخدام الحركات الجسدية التي تم التدرب عليها مسبقًا، يُظهر Gemini Robotics، وفقًا للتقارير، تحسنًا ملحوظًا في البراعة. تفتح هذه البراعة المكتشفة حديثًا مهامًا لم يكن من الممكن تحقيقها سابقًا، مثل فن طي الأوريجامي الدقيق والتعبئة الدقيقة للوجبات الخفيفة في أكياس Zip-loc. هذا الانتقال – من الروبوتات التي تفهم الأوامر فقط إلى الروبوتات القادرة على تنفيذ مهام جسدية دقيقة – يشير إلى أن DeepMind قد تكون على وشك حل أحد أكثر التحديات استمرارًا في الروبوتات: تمكين الروبوتات من ترجمة “معرفتها” إلى حركات دقيقة وحذرة في العالم الحقيقي.

التعميم: مفتاح القدرة على التكيف في العالم الحقيقي

تؤكد DeepMind أن نظام Gemini Robotics الجديد يُظهر تعميمًا محسّنًا بشكل كبير – القدرة على أداء مهام جديدة لم يتم تدريبه عليها بشكل صريح. هذا تقدم حاسم. وفقًا لإعلان الشركة، فإن Gemini Robotics “يضاعف الأداء أكثر من الضعف في معيار تعميم شامل مقارنة بنماذج الرؤية واللغة والعمل الأخرى الحديثة.”

التعميم أمر بالغ الأهمية لأن الروبوتات القادرة على التكيف مع السيناريوهات الجديدة دون الحاجة إلى تدريب محدد لكل موقف هي مفتاح التشغيل الفعال في بيئات العالم الحقيقي غير المتوقعة. هذه القدرة على التكيف هي ما يفصل الروبوت المتخصص والمحدد المهام عن آلة متعددة الاستخدامات وقابلة للتكيف حقًا.

دماغ روبوت عام: رؤية جوجل الطموحة

تتجه جهود جوجل بوضوح نحو إنشاء “دماغ روبوت عام” – وهو ذكاء اصطناعي متعدد الاستخدامات قادر على التحكم في مجموعة واسعة من منصات الروبوتات. تماشياً مع هذه الرؤية، أعلنت الشركة عن شراكة مع Apptronik، وهي شركة روبوتات رائدة، “لبناء الجيل التالي من الروبوتات الشبيهة بالبشر باستخدام Gemini 2.0.”

على الرغم من تدريبه بشكل أساسي على منصة روبوت ثنائية اليد تُعرف باسم ALOHA 2، إلا أن جوجل تذكر أن Gemini Robotics يمتلك القدرة على التحكم في أنواع مختلفة من الروبوتات. وهذا يشمل أذرع Franka الآلية الموجهة نحو البحث وأنظمة شبيهة بالبشر أكثر تطوراً مثل روبوت Apollo من Apptronik. تؤكد هذه القدرة على التكيف إمكانية أن يصبح Gemini Robotics “دماغًا” عالميًا لمجموعة واسعة من تطبيقات الروبوتات.

مشهد الروبوتات الشبيهة بالبشر: التقاء الأجهزة والبرامج

السعي وراء الروبوتات الشبيهة بالبشر هو مسعى تعاوني، حيث تساهم العديد من الشركات في جوانب مختلفة من التحدي. تعمل شركات مثل Figure AI و Boston Dynamics (التي كانت سابقًا شركة تابعة لـ Alphabet) بجد على تطوير أجهزة روبوتات شبيهة بالبشر متقدمة. ومع ذلك، فإن “المحرك” الفعال للذكاء الاصطناعي – المكون البرمجي الذي يمنح هذه الروبوتات الذكاء والاستقلالية – ظل يمثل قطعة مفقودة حاسمة.

تكتسب جهود جوجل في هذا المجال زخمًا. منحت الشركة وصولاً محدودًا إلى Gemini Robotics-ER من خلال برنامج “المختبر الموثوق به” لشركات الروبوتات الرائدة، بما في ذلك Boston Dynamics و Agility Robotics و Enchanted Tools. يشير هذا النهج التعاوني إلى جهد متضافر لتسريع تطوير ونشر روبوتات شبيهة بالبشر قادرة حقًا.

السلامة أولاً: نهج متعدد الطبقات للروبوتات المسؤولة

إدراكًا للأهمية القصوى للسلامة في الروبوتات، تؤكد جوجل على “نهج متعدد الطبقات وشامل” يتضمن تدابير السلامة التقليدية للروبوتات. تشمل هذه الإجراءات تجنب الاصطدام وقيود القوة، مما يضمن عمل الروبوتات ضمن معايير آمنة.

علاوة على ذلك، تصف الشركة تطوير إطار عمل “دستور الروبوت”. يوفر هذا الإطار، المستوحى من قوانين إسحاق أسيموف الثلاثة للروبوتات، مجموعة من المبادئ التوجيهية للتطوير والنشر الأخلاقي والآمن للروبوتات. بالاقتران مع هذا الإطار، أصدرت جوجل مجموعة بيانات، أطلق عليها اسم “ASIMOV”، مصممة لمساعدة الباحثين في تقييم الآثار المترتبة على سلامة إجراءات الروبوت.

مجموعة بيانات ASIMOV: توحيد تقييم السلامة

تمثل مجموعة بيانات ASIMOV مسعى جوجل لوضع طرق موحدة لتقييم سلامة الروبوت، وتمتد إلى ما هو أبعد من منع الضرر المادي. تم تصميم مجموعة البيانات لمساعدة الباحثين على تقييم مدى فهم نماذج الذكاء الاصطناعي للعواقب المحتملة لأفعال الروبوت في سيناريوهات مختلفة. وفقًا لإعلان جوجل، فإن مجموعة البيانات “ستساعد الباحثين على قياس الآثار المترتبة على سلامة إجراءات الروبوت بدقة في سيناريوهات العالم الحقيقي.” تؤكد هذه المبادرة التزام جوجل بالابتكار المسؤول في مجال الروبوتات.

مستقبل الروبوتات: لمحة عن الاحتمالات

في حين أن جوجل لم تعلن بعد عن جداول زمنية محددة أو تطبيقات تجارية لنماذج الذكاء الاصطناعي الجديدة، والتي لا تزال حاليًا في مرحلة البحث، إلا أن التطورات التي تم إثباتها مهمة بلا شك. تعرض مقاطع الفيديو التوضيحية التي أصدرتها جوجل تقدمًا ملحوظًا في القدرات التي يحركها الذكاء الاصطناعي. ومع ذلك، من المهم الاعتراف بأن هذه العروض التوضيحية قد أجريت في بيئات بحثية خاضعة للرقابة. يكمن الاختبار الحقيقي لهذه الأنظمة في قدرتها على الأداء بشكل موثوق وآمن في البيئات الديناميكية وغير المتوقعة للعالم الحقيقي.

يمثل تطوير Gemini Robotics و Gemini Robotics-ER لحظة محورية في تطور الروبوتات. تتمتع هذه النماذج بالقدرة على فتح حقبة جديدة من البراعة والقدرة على التكيف والاستقلالية، مما يمهد الطريق للروبوتات للاندماج بسلاسة في حياتنا والمساهمة في مجموعة واسعة من المهام. مع تقدم البحث ونضوج هذه التقنيات، يمكننا أن نتوقع مستقبلاً تلعب فيه الروبوتات دورًا بارزًا بشكل متزايد في منازلنا وأماكن عملنا ومجتمعاتنا. الرحلة نحو الذكاء الاصطناعي المتجسد حقًا مستمرة، لكن أحدث التطورات التي حققتها جوجل تقدم لمحة مقنعة عن الاحتمالات المثيرة التي تنتظرنا. إن اندماج الأجهزة المتطورة والبرامج الذكية بشكل متزايد يستعد لتحويل مشهد الروبوتات، مما يقربنا من مستقبل لا تكون فيه الروبوتات مجرد أدوات، بل شركاء متعددي الاستخدامات في حياتنا اليومية.