کلود شرکت Anthropic پوکمون را بازی می‌کند

آزمایشی نامتعارف برای سنجش استدلال

Anthropic، یک شرکت پیشرو در تحقیقات هوش مصنوعی، آزمایشی منحصر به فرد را برای تست قابلیت‌های آخرین مدل هوش مصنوعی خود، Claude 3.7 Sonnet، آغاز کرده است. به جای معیارهای سنتی، Anthropic رویکردی غیرمتعارف را انتخاب کرده است: اجازه دادن به هوش مصنوعی برای بازی Pokémon Red در یک پخش زنده Twitch. این تلاش توجه مخاطبان متنوعی را به خود جلب کرده است، زیرا بینندگان برای مشاهده پیشرفت آهسته اما سنجیده هوش مصنوعی در این عنوان کلاسیک Game Boy، هماهنگ می‌شوند.

چرا پوکمون؟ چالشی شگفت‌آور و پیچیده

در نگاه اول، Pokémon Red، بازی‌ای که عمدتاً برای کودکان طراحی شده است، ممکن است انتخابی عجیب برای ارزیابی یک هوش مصنوعی پیشرفته به نظر برسد. با این حال، این بازی مجموعه‌ای از چالش‌های شگفت‌آور پیچیده را ارائه می‌دهد که نیازمند استدلال منطقی، حل مسئله و برنامه‌ریزی استراتژیک است. این‌ها دقیقاً همان حوزه‌هایی هستند که Anthropic قصد دارد مرزهای توسعه هوش مصنوعی را در آن‌ها جابجا کند.

ماهیت جهان باز بازی، با هزارتوی معماهای به هم پیوسته، موانع و تعاملات شخصیتی، محیطی غنی را برای آزمایش توانایی هوش مصنوعی در موارد زیر فراهم می‌کند:

  • درک و پاسخ به دستورالعمل‌های زبان طبیعی: هوش مصنوعی باید دستورات متنی و بازخورد محیط بازی را تفسیر کند.
  • تدوین اهداف کوتاه مدت و بلند مدت: از انتخاب پوکمون مناسب برای نبرد تا مسیریابی در مسیرهای پیچیده، هوش مصنوعی باید از قبل برنامه‌ریزی کند.
  • سازگاری با موقعیت‌های غیرمنتظره: بازی پر از برخوردهای تصادفی و رویدادهای غیرقابل پیش‌بینی است که هوش مصنوعی را مجبور می‌کند استراتژی‌های خود را در حین حرکت تنظیم کند.
  • یادگیری از تجربه: هوش مصنوعی باید موفقیت‌ها و شکست‌های گذشته را به خاطر بسپارد تا عملکرد خود را در طول زمان بهبود بخشد.

پیشرفت آهسته و پیوسته: سفر هوش مصنوعی

پخش زنده، سفری جذاب، اگرچه اغلب آهسته، از Claude 3.7 Sonnet در دنیای پوکمون را نشان داده است. گیم‌پلی هوش مصنوعی با ترکیبی از شاهکارهای چشمگیر استدلال و لحظاتی از سردرگمی مطلق مشخص می‌شود.

در مراحل اولیه، هوش مصنوعی حتی با ابتدایی‌ترین وظایف نیز دست و پنجه نرم می‌کرد. ترک شهر شروع، وظیفه‌ای که یک بازیکن انسانی می‌تواند در عرض چند دقیقه انجام دهد، به یک مانع مهم برای Claude تبدیل شد. این هوش مصنوعی ساعت‌ها با کنترل‌ها و چیدمان فضایی بازی دست و پنجه نرم می‌کرد، اغلب در گوشه‌ها گیر می‌کرد یا به طور مکرر با اشیاء مشابه تعامل می‌کرد.

با این حال، با پیشرفت پخش، هوش مصنوعی شروع به نشان دادندرک فزاینده‌ای از مکانیک بازی کرد. یاد گرفت که چگونه:

  1. در مناطق مختلف حرکت کند.
  2. در نبرد با مربیان پوکمون دیگر شرکت کند.
  3. پوکمون‌های وحشی را بگیرد.
  4. از آیتم‌ها به صورت استراتژیک استفاده کند.
  5. حتی چندین رهبر باشگاه (gym leaders) را شکست دهد، که یک نقطه عطف مهم در بازی است.

لحظات درخشش و سرخوردگی

لحظات درخشش هوش مصنوعی اغلب با دوره‌هایی از عدم فعالیت ناامیدکننده یا تصمیمات به ظاهر غیرمنطقی همراه است. مواردی وجود داشته است که Claude:

  • به اشیاء به ظاهر بی‌اهمیت، مانند یک دیوار سنگی، خیره می‌شد و ساعت‌ها تلاش می‌کرد تا با آن تعامل کند، قبل از اینکه در نهایت راه خود را پیدا کند.
  • در نبرد انتخاب‌های گیج‌کننده‌ای انجام می‌داد، مانند استفاده از حرکات بی‌اثر یا تعویض به پوکمون‌های ضعیف‌تر.
  • در حلقه‌ها گیر می‌کرد و اقدامات مشابه را بارها و بارها بدون هیچ پیشرفتی تکرار می‌کرد.

این لحظات چالش‌های ذاتی توسعه هوش مصنوعی را که می‌تواند واقعاً محیط‌های پیچیده و پویا را درک کند و با آن‌ها تعامل داشته باشد، برجسته می‌کند. در حالی که Claude 3.7 Sonnet گام‌های مهمی در استدلال و حل مسئله برداشته است، هنوز راه زیادی در پیش دارد تا بتواند با درک شهودی و سازگاری یک بازیکن انسانی مطابقت داشته باشد.

اشاره‌ای به گذشته: ‘Twitch Plays Pokémon’

این آزمایش به ناچار مقایسه‌هایی را با پدیده ویروسی ‘Twitch Plays Pokémon’ که چندین سال پیش اینترنت را مجذوب خود کرد، به همراه دارد. در آن آزمایش، هزاران بیننده Twitch برای کنترل یک شخصیت واحد در Pokémon Red، با استفاده از دستورات متنی در چت، همکاری کردند. نتیجه یک گیم‌پلی پر هرج و مرج اما در نهایت موفق بود که توسط هوش جمعی (و گاهی اوقات ترول کردن) جامعه آنلاین هدایت می‌شد.

آزمایش Anthropic، با این حال، نشان دهنده یک انحراف قابل توجه از این مدل مشارکتی است. در اینجا، هوش مصنوعی به صورت انفرادی بازی می‌کند و سعی می‌کند بدون هیچ گونه مداخله انسانی، بر چالش‌های بازی غلبه کند. این تغییر از گیم‌پلی جمعی انسانی به کنترل فردی هوش مصنوعی، واکنش‌های متفاوتی را از سوی بینندگان برانگیخته است. برخی از پیشرفت تکنولوژیکی به نمایش گذاشته شده شگفت‌زده می‌شوند، در حالی که برخی دیگر از فقدان تجربه مشترک و طنز غیرقابل پیش‌بینی که مشخصه ‘Twitch Plays Pokémon’ بود، ابراز تاسف می‌کنند.

تصویر بزرگتر: پیامدهایی برای توسعه هوش مصنوعی

فراتر از ارزش سرگرمی، آزمایش پوکمون Anthropic پیامدهای گسترده‌تری برای حوزه توسعه هوش مصنوعی دارد. این آزمایش بینش‌های ارزشمندی را در مورد نقاط قوت و ضعف مدل‌های هوش مصنوعی فعلی، به ویژه در زمینه‌های زیر ارائه می‌دهد:

  • پردازش زبان طبیعی: توانایی هوش مصنوعی برای درک و پاسخ به اطلاعات متنی در بازی برای موفقیت آن بسیار مهم است.
  • یادگیری تقویتی: هوش مصنوعی از طریق آزمون و خطا یاد می‌گیرد و به تدریج عملکرد خود را بر اساس پاداش‌ها و مجازات‌هایی که در بازی دریافت می‌کند، بهبود می‌بخشد.
  • تعمیم: توانایی هوش مصنوعی برای به کارگیری آنچه در یک موقعیت آموخته است در موقعیت‌های جدید و ناآشنا، کلید پیشرفت بلندمدت آن است.

با مطالعه نحوه برخورد Claude 3.7 Sonnet با چالش‌های Pokémon Red، محققان Anthropic می‌توانند درک بهتری از نحوه توسعه سیستم‌های هوش مصنوعی به دست آورند که قوی‌تر، سازگارتر و قادر به مدیریت پیچیدگی‌های دنیای واقعی باشند.

آینده هوش مصنوعی و بازی‌ها

تقاطع هوش مصنوعی و بازی‌های ویدیویی یک حوزه به سرعت در حال تحول است که کاربردهای بالقوه آن بسیار فراتر از سرگرمی است. بازی‌ها محیطی کنترل‌شده و قابل اندازه‌گیری را برای آزمایش و پالایش الگوریتم‌های هوش مصنوعی فراهم می‌کنند و درس‌های آموخته شده را می‌توان در طیف گسترده‌ای از مشکلات دنیای واقعی به کار برد، مانند:

  • رباتیک: آموزش ربات‌ها برای حرکت در محیط‌های پیچیده و تعامل با اشیاء.
  • وسایل نقلیه خودران: توسعه خودروهای خودرانی که می‌توانند تصمیمات ایمن و قابل اعتمادی را در شرایط ترافیکی غیرقابل پیش‌بینی بگیرند.
  • مراقبت‌های بهداشتی: ایجاد ابزارهای تشخیصی مبتنی بر هوش مصنوعی و برنامه‌های درمانی شخصی‌سازی شده.
  • آموزش: طراحی سیستم‌های آموزشی هوشمندی که می‌توانند با نیازهای فردی دانش‌آموزان سازگار شوند.

با ادامه پیشرفت فناوری هوش مصنوعی، می‌توان انتظار داشت که شاهد کاربردهای پیچیده‌تر و شگفت‌انگیزتری از هوش مصنوعی در بازی‌های ویدیویی و فراتر از آن باشیم. آزمایش پوکمون Anthropic تنها یک گام کوچک در این سفر هیجان‌انگیز است، اما نگاهی اجمالی به پتانسیل هوش مصنوعی برای تغییر نحوه زندگی، کار و بازی ما ارائه می‌دهد.
این بازی ممکن است برای کودکان طراحی شده باشد، اما ثابت می کند که ابزاری بسیار مفید برای تحقیقات هوش مصنوعی است. چالش های محیط، هوش مصنوعی را مجبور به توسعه مهارت های استدلال می کند و فرصت های زیادی برای یادگیری ارائه می دهد. در حالی که هوش مصنوعی دور از کامل بودن است، نشان داده است که مدل ها در حل پازل های پیچیده بهتر می شوند.
این آزمایش خاطرات ‘Twitch Plays Pokemon’ را زنده کرده است، جایی که هزاران نفر با هم کار کردند. اکنون، هوش مصنوعی به تنهایی با این چالش ها روبرو می شود و نشان می دهد که فناوری چقدر پیشرفت کرده است. این یک تغییر بزرگ از گیم پلی مشارکتی انسانی به یک ماشین در حال بازی است و نشان می دهد که هوش مصنوعی چقدر در حال رشد است.