وعد الذكاء الاصطناعي العام (AGI)
في مجال الذكاء الاصطناعي المزدهر، أصبح مفهوم ‘الذكاء الاصطناعي العام’ (AGI) احتمالًا مثيرًا. يشير قادة الصناعة بشكل متزايد إلى أننا على أعتاب إنشاء وكلاء افتراضيين قادرين على مطابقة، أو حتى تجاوز، الفهم والأداء البشري عبر مجموعة واسعة من المهام المعرفية. وقد أدى هذا الترقب إلى سباق بين شركات التكنولوجيا، تسعى كل منها لتكون أول من يحقق هذا الإنجاز الرائد.
OpenAI، وهي لاعب رئيسي في ساحة الذكاء الاصطناعي، تلمح بمهارة إلى الوصول الوشيك لوكيل ذكاء اصطناعي ‘بمستوى الدكتوراه’. ويشيرون إلى أن هذا الوكيل يمكن أن يعمل بشكل مستقل، ويؤدي على مستوى ‘عامل معرفي ذي دخل مرتفع’. وقد قدم إيلون ماسك، رائد الأعمال الطموح، تنبؤات أكثر جرأة، مشيرًا إلى أنه من المحتمل أن يكون لدينا ذكاء اصطناعي ‘أذكى من أي إنسان’ بحلول نهاية عام 2025. ويقدم داريو أمودي، الرئيس التنفيذي لشركة Anthropic، وهي شركة ذكاء اصطناعي بارزة أخرى، جدولًا زمنيًا أكثر تحفظًا بقليل ولكنه يشارك رؤية مماثلة، مما يشير إلى أن الذكاء الاصطناعي يمكن أن يكون ‘أفضل من البشر في كل شيء تقريبًا’ بحلول نهاية عام 2027.
تجربة Anthropic ‘كلود يلعب بوكيمون’
وسط هذه الخلفية من التنبؤات الطموحة، قدمت Anthropic تجربتها ‘Claude Plays Pokémon’ الشهر الماضي. وقد وُصف هذا المشروع، الذي قُدم كخطوة نحو مستقبل الذكاء الاصطناعي العام المتوقع، بأنه يعرض ‘لمحات من أنظمة الذكاء الاصطناعي التي تتصدى للتحديات بكفاءة متزايدة، ليس فقط من خلال التدريب ولكن من خلال التفكير المعمم’. وقد حازت Anthropic على اهتمام كبير من خلال تسليط الضوء على كيفية تمكين ‘قدرات التفكير المحسنة’ لـ Claude 3.7 Sonnet أحدث نموذج للشركة من إحراز تقدم في لعبة Game Boy RPG الكلاسيكية، Pokémon، بطرق ‘لم يكن لدى النماذج القديمة أمل كبير في تحقيقها’.
أكدت الشركة أن ‘التفكير الممتد’ لـ Claude 3.7 Sonnet سمح للنموذج الجديد ‘بالتخطيط للمستقبل، وتذكر أهدافه، والتكيف عندما تفشل الاستراتيجيات الأولية’. وجادلت Anthropic بأن هذه ‘مهارات حاسمة لمحاربة قادة الصالات الرياضية ذوي البيكسلات. ونفترض أنها كذلك في حل مشاكل العالم الحقيقي أيضًا’. وكان المعنى الضمني واضحًا: لم يكن تقدم كلود في Pokémon مجرد لعبة؛ بل كان دليلًا على قدرة الذكاء الاصطناعي الناشئة على معالجة تحديات العالم الحقيقي المعقدة.
التحقق من الواقع: صراعات كلود
ومع ذلك، فقد خف الحماس الأولي المحيط بأداء كلود في Pokémon بجرعة من الواقع. في حين أن Claude 3.7 Sonnet تفوق بلا شك على أسلافه، إلا أنه لم يحقق إتقانًا للعبة. وقد شهد آلاف المشاهدين على Twitch صراعات كلود المستمرة، ولاحظوا أخطاءه المتكررة وعدم كفاءته.
على الرغم من فترات التوقف ‘للتفكير’ الممتدة بين الحركات – والتي يمكن للمشاهدين خلالها ملاحظة عملية التفكير المحاكاة للنظام – غالبًا ما يجد كلود نفسه:
- إعادة زيارة المدن المكتملة: يعود الذكاء الاصطناعي بشكل متكرر إلى المناطق التي استكشفها بالفعل، على ما يبدو بدون هدف.
- عالقًا في الزوايا العمياء: غالبًا ما يصبح كلود محاصرًا في زوايا الخريطة لفترات طويلة، غير قادر على التنقل في طريقه للخروج.
- التفاعل بشكل متكرر مع الشخصيات غير المساعدة (NPCs): لوحظ أن الذكاء الاصطناعي يشارك في محادثات غير مجدية مع نفس الشخصيات غير اللاعبة مرارًا وتكرارًا.
هذه الأمثلة على الأداء دون المستوى البشري بشكل واضح في اللعبة ترسم صورة بعيدة كل البعد عن الذكاء الخارق الذي يتصوره البعض. عند مشاهدة كلود وهو يكافح مع لعبة مصممة للأطفال، يصبح من الصعب تخيل أننا نشهد فجر حقبة جديدة من ذكاء الكمبيوتر.
دروس من الأداء دون المستوى البشري
على الرغم من أوجه القصور فيه، فإن مستوى أداء كلود الحالي في Pokémon يقدم رؤى قيمة حول السعي المستمر لتحقيق ذكاء اصطناعي عام بمستوى الإنسان. حتى صراعاته تحمل دروسًا مهمة يمكن أن تفيد جهود التطوير المستقبلية.
بمعنى ما، من الرائع أن كلود يمكنه لعب Pokémon على الإطلاق. عند تطوير أنظمة الذكاء الاصطناعي لألعاب مثل Go و Dota 2، عادةً ما يزود المهندسون خوارزمياتهم بمعرفة واسعة بقواعد اللعبة واستراتيجياتها، إلى جانب وظيفة مكافأة لتوجيه تعلمهم. في المقابل، بدأ ديفيد هيرشي، المطور وراء مشروع Claude Plays Pokémon، بنموذج Claude عام غير معدل لم يتم تدريبه أو ضبطه خصيصًا للعب ألعاب Pokémon.
أوضح هيرشي لـ Ars: ‘هذا هو مجرد الأشياء الأخرى المختلفة التي يفهمها [كلود] عن العالم والتي تُستخدم للإشارة إلى ألعاب الفيديو’. وأضاف: ‘لذلك لديه إحساس ببوكيمون. إذا ذهبت إلى claude.ai وسألت عن Pokémon، فإنه يعرف ما هو Pokémon بناءً على ما قرأه… إذا سألت، فسيخبرك أن هناك ثمانية شارات صالة ألعاب رياضية، وسيخبرك أن الأول هو Brock… إنه يعرف الهيكل العريض’.
تحديات التفسير البصري
بالإضافة إلى مراقبة عناوين RAM الرئيسية في Game Boy للحصول على معلومات عن حالة اللعبة، يفسر كلود الإخراج المرئي للعبة تمامًا كما يفعل اللاعب البشري. ومع ذلك، على الرغم من التطورات الأخيرة في معالجة صور الذكاء الاصطناعي، لا يزال كلود يكافح لتفسير العالم المنخفض الدقة والمبكسل للقطة شاشة Game Boy بنفس الدقة التي يتمتع بها الإنسان.
اعترف هيرشي: ‘لا يزال كلود غير جيد بشكل خاص في فهم ما هو موجود على الشاشة على الإطلاق’. ‘سترى أنه يحاول السير في الجدران طوال الوقت’.
يشتبه هيرشي في أن بيانات تدريب كلود تفتقر على الأرجح إلى أوصاف نصية مفصلة للصور التي تشبه شاشات Game Boy. وهذا يعني أنه، على عكس ما هو متوقع، قد يكون أداء كلود أفضل في الواقع مع صور أكثر واقعية.
أشار هيرشي: ‘إنها واحدة من تلك الأشياء المضحكة عن البشر أننا نستطيع أن ننظر إلى هذه النقاط البيكسلية الثمانية في ثمانية للأشخاص ونقول، ‘هذه فتاة ذات شعر أزرق’’. ‘أعتقد أن الناس لديهم القدرة على رسم خريطة من عالمنا الحقيقي لفهم هذا النوع من الأشياء… لذلك أنا بصراحة مندهش نوعًا ما من أن كلود جيد كما هو في القدرة على رؤية وجود شخص على الشاشة’.
نقاط قوة مختلفة، نقاط ضعف مختلفة
حتى مع التفسير البصري المثالي، يعتقد هيرشي أن كلود سيظل يعاني من تحديات التنقل ثنائي الأبعاد التي تعتبر تافهة بالنسبة للبشر. وقال: ‘من السهل جدًا بالنسبة لي أن أفهم أن المبنى [داخل اللعبة] هو مبنى وأنه لا يمكنني المشي عبر مبنى’. ‘وهذا [شيء] يمثل تحديًا كبيرًا لكلود لفهمه… إنه أمر مضحك لأنه ذكي بطرق مختلفة، كما تعلم؟’
حيث يتفوق كلود، وفقًا لهيرشي، هو في الجوانب الأكثر نصية للعبة. أثناء المعارك، يلاحظ كلود بسهولة عندما تشير اللعبة إلى أن هجوم بوكيمون من النوع الكهربائي ‘ليس فعالًا جدًا’ ضد خصم من النوع الصخري. ثم يقوم بتخزين هذه المعلومات في قاعدة معارفه المكتوبة الواسعة للرجوع إليها في المستقبل. يمكن لكلود أيضًا دمج أجزاء متعددة من المعرفة في استراتيجيات معركة متطورة، وحتى توسيع هذه الاستراتيجيات إلى خطط طويلة الأجل لالتقاط وإدارة فرق من Pokémon.
يُظهر كلود أيضًا ‘ذكاءً’ مفاجئًا عندما يكون نص اللعبة مضللًا أو غير مكتمل عن قصد. استشهد هيرشي بمهمة في بداية اللعبة حيث يُطلب من اللاعب العثور على البروفيسور أوك في الجوار، ليكتشف أنه ليس هناك. قال هيرشي: ‘عندما كنت في الخامسة من عمري، كان ذلك مربكًا للغاية بالنسبة لي’. ‘لكن كلود يمر عادةً بنفس مجموعة الحركات حيث يتحدث إلى أمي، ويذهب إلى المختبر، ولا يجد [أوك]، ويقول، ‘أحتاج إلى اكتشاف شيء ما’… إنه متطور بما يكفي للمرور بحركات الطريقة التي من المفترض أن يتعلمها [البشر] بالفعل أيضًا’.
أوضح هيرشي أن نقاط القوة والضعف المتناقضة هذه، مقارنة باللعب على مستوى الإنسان، تعكس الحالة العامة لأبحاث وقدرات الذكاء الاصطناعي. ‘أعتقد أنه مجرد شيء عالمي حول هذه النماذج… لقد بنينا الجانب النصي منه أولاً، والجانب النصي هو بالتأكيد… أكثر قوة. إن كيفية تفكير هذه النماذج في الصور تتحسن، لكنني أعتقد أنها متأخرة قليلاً’.
حدود الذاكرة
بالإضافة إلى التحديات المتعلقة بالتفسير البصري والنصي، أقر هيرشي بأن كلود يعاني من ‘تذكر’ ما تعلمه. يحتوي النموذج الحالي على ‘نافذة سياق’ مكونة من 200000 رمز، مما يحد من مقدار المعلومات العلائقية التي يمكنه تخزينها في ‘ذاكرته’ في أي وقت. عندما تملأ قاعدة المعرفة المتوسعة للنظام هذه النافذة، يخضع كلود لعملية تلخيص متقنة، حيث يقوم بتكثيف الملاحظات التفصيلية في ملخصات أقصر تفقد حتمًا بعض التفاصيل الدقيقة.
قال هيرشي: ‘قد يؤدي هذا إلى أن يواجه كلود صعوبة في تتبع الأشياء لفترة طويلة جدًا وأن يكون لديه إحساس كبير بما جربه حتى الآن’. ‘سترى بالتأكيد أنه يحذف أحيانًا شيئًا لا ينبغي له حذفه. أي شيء ليس في قاعدة معارفك أو ليس في ملخصك سيختفي، لذلك عليك التفكير فيما تريد وضعه هناك’.
مخاطر المعلومات غير الصحيحة
الأمر الأكثر إشكالية من نسيان المعلومات المهمة هو ميل كلود إلى إدخال معلومات غير صحيحة عن غير قصد في قاعدة معارفه. مثل منظّر المؤامرة الذي يبني نظرة عالمية على فرضية خاطئة، يمكن أن يكون كلود بطيئًا بشكل ملحوظ في إدراك متى يؤدي خطأ في قاعدة معارفه المؤلفة ذاتيًا إلى تضليل لعبه في Pokémon.
قال هيرشي: ‘الأشياء المكتوبة في الماضي، يثق بها بشكل أعمى إلى حد ما’. ‘لقد رأيته مقتنعًا جدًا بأنه وجد مخرجًا إلى [موقع داخل اللعبة] Viridian Forest عند إحداثيات معينة، ثم يقضي ساعات وساعات في استكشاف مربع صغير حول تلك الإحداثيات الخاطئة بدلاً من فعل أي شيء آخر. يستغرق الأمر وقتًا طويلاً جدًا ليقرر أن هذا كان ‘فشلًا’’.
على الرغم من هذه التحديات، أشار هيرشي إلى أن Claude 3.7 Sonnet أفضل بكثير من النماذج السابقة في ‘التشكيك في افتراضاته، وتجربة استراتيجيات جديدة، وتتبع استراتيجيات مختلفة على مدى فترات طويلة لمعرفة ما إذا كانت تعمل أم لا’. في حين أن النموذج الجديد لا يزال ‘يعاني لفترات طويلة جدًا من الوقت’ في إعادة محاولة نفس الإجراءات، إلا أنه يميل في النهاية إلى ‘الحصول على إحساس بما يحدث وما جربه من قبل، ويتعثر في كثير من الأحيان في تقدم حقيقي من ذلك’، قال هيرشي.
الطريق إلى الأمام
قال هيرشي إن أحد أكثر الجوانب الرائعة لمراقبة Claude Plays Pokémon عبر تكرارات متعددة هو رؤية كيف يمكن أن يختلف تقدم النظام واستراتيجيته بشكل كبير بين عمليات التشغيل. في بعض الأحيان، يُظهر كلود ‘قدرته على بناء استراتيجية متماسكة إلى حد ما’ من خلال ‘الاحتفاظ بملاحظات مفصلة حول المسارات المختلفة التي يجب تجربتها’، كما أوضح. لكن ‘في معظم الأوقات لا يفعل ذلك… في معظم الأوقات، يتجول في الحائط لأنه واثق من أنه يرى المخرج’.
وفقًا لهيرشي، فإن أحد القيود الرئيسية للإصدار الحالي من Claude هو أنه ‘عندما يستمد هذه الاستراتيجية الجيدة، لا أعتقد أنه بالضرورة لديه الوعي الذاتي ليعرف أن إحدى الاستراتيجيات التي توصل إليها أفضل من الأخرى’. وأقر بأن هذه ليست مشكلة تافهة لحلها.
ومع ذلك، يرى هيرشي ‘ثمارًا منخفضة’ لتحسين لعب كلود في Pokémon من خلال تعزيز فهم النموذج للقطات شاشة Game Boy. وقال: ‘أعتقد أن هناك فرصة للتغلب على اللعبة إذا كان لديه إحساس مثالي بما هو موجود على الشاشة’، مشيرًا إلى أن مثل هذا النموذج من المحتمل أن يؤدي ‘أقل قليلاً من الإنسان’.
وأضاف هيرشي أن توسيع نافذة السياق لنماذج Claude المستقبلية سيمكنهم أيضًا على الأرجح من ‘التفكير على مدى فترات زمنية أطول والتعامل مع الأشياء بشكل أكثر تماسكًا على مدى فترة طويلة من الزمن’. وقال إن النماذج المستقبلية ستتحسن من خلال ‘التحسن قليلاً في التذكر، وتتبع مجموعة متماسكة مما يحتاج إلى محاولة إحراز تقدم’.
في حين أن احتمال التحسينات الوشيكة في نماذج الذكاء الاصطناعي لا يمكن إنكاره، فإن أداء كلود الحالي في Pokémon لا يشير إلى أنه على وشك الدخول في حقبة من الذكاء الاصطناعي العام على مستوى الإنسان. اعترف هيرشي بأن مشاهدة Claude 3.7 Sonnet عالقًا في Mt. Moon لمدة 80 ساعة يمكن أن يجعله ‘يبدو وكأنه نموذج لا يعرف ما يفعله’.
ومع ذلك، لا يزال هيرشي معجبًا بلمحات الوعي العرضية التي يعرضها نموذج التفكير الجديد لكلود، مشيرًا إلى أنه في بعض الأحيان ‘يخبر نوعًا ما أنه لا يعرف ما يفعله ويعرف أنه بحاجة إلى القيام بشيء مختلف. والفرق بين ‘لا يمكن القيام بذلك على الإطلاق’ و ‘يمكن القيام بذلك نوعًا ما’ هو فرق كبير جدًا بالنسبة لأشياء الذكاء الاصطناعي هذه بالنسبة لي’، وتابع. ‘كما تعلم، عندما يكون هناك شيء ما يمكنه القيام بشيء ما، فهذا يعني عادةً أننا قريبون جدًا من جعله قادرًا على فعل شيء ما بشكل جيد حقًا’.