Claude AI od Anthropic gra w Pokémon Red

Niekonwencjonalny test rozumowania

Anthropic, wiodąca firma zajmująca się badaniami nad sztuczną inteligencją, rozpoczęła unikalny eksperyment, aby przetestować możliwości swojego najnowszego modelu AI, Claude 3.7 Sonnet. Zamiast tradycyjnych testów porównawczych, Anthropic wybrało bardziej niekonwencjonalne podejście: pozwolenie AI na grę w Pokémon Red na żywo na Twitchu. To przedsięwzięcie przyciągnęło uwagę zróżnicowanej publiczności, a widzowie śledzą powolne, ale celowe postępy AI w klasycznym tytule Game Boy.

Dlaczego Pokémon? Zaskakująco złożone wyzwanie

Na pierwszy rzut oka Pokémon Red, gra zaprojektowana głównie dla dzieci, może wydawać się dziwnym wyborem do oceny najnowocześniejszej sztucznej inteligencji. Jednak gra stawia zaskakująco złożony zestaw wyzwań, które wymagają logicznego rozumowania, rozwiązywania problemów i planowania strategicznego. Są to dokładnie te obszary, w których Anthropic dąży do przekraczania granic rozwoju AI.

Otwarty świat gry, z mnóstwem połączonych ze sobą łamigłówek, przeszkód i interakcji z postaciami, zapewnia bogate środowisko do testowania zdolności AI do:

  • Rozumienia i reagowania na instrukcje w języku naturalnym: AI musi interpretować tekstowe polecenia i informacje zwrotne ze środowiska gry.
  • Formułowania krótko- i długoterminowych celów: Od wyboru odpowiedniego Pokémona do bitwy po nawigację po skomplikowanych trasach, AI musi planować z wyprzedzeniem.
  • Dostosowywania się do nieoczekiwanych sytuacji: Gra jest pełna losowych spotkań i nieprzewidywalnych zdarzeń, zmuszając AI do dostosowywania swoich strategii w locie.
  • Uczenia się na podstawie doświadczenia: AI musi pamiętać przeszłe sukcesy i porażki, aby poprawić swoją wydajność w czasie.

Powolny i stały postęp: Podróż AI

Transmisja na żywo ujawniła fascynującą, choć często powolną, podróż Claude 3.7 Sonnet przez świat Pokémonów. Rozgrywka AI charakteryzuje się mieszanką imponujących wyczynów rozumowania i momentów całkowitego osłupienia.

We wczesnych etapach AI zmagało się nawet z najprostszymi zadaniami. Opuszczenie miasta startowego, zadanie, które ludzki gracz mógłby wykonać w kilka minut, okazało się znaczącą przeszkodą dla Claude’a. Spędził godziny zmagając się z kontrolkami gry i układem przestrzennym, często utykając w rogach lub wielokrotnie wchodząc w interakcje z tymi samymi obiektami.

Jednak w miarę postępu transmisji AI zaczęło wykazywać rosnące zrozumienie mechaniki gry. Nauczyło się:

  1. Nawigować po różnych obszarach.
  2. Angażować się w bitwy z innymi trenerami Pokémon.
  3. Łapać dzikie Pokémony.
  4. Strategicznie używać przedmiotów.
  5. Pokonać nawet kilku liderów sal, co jest kamieniem milowym w grze.

Momenty błyskotliwości i frustracji

Momenty błyskotliwości AI są często przeplatane okresami frustrującej bezczynności lub pozornie nielogicznych decyzji. Zdarzały się przypadki, gdy Claude:

  • Fiksował się na pozornie nieistotnych obiektach, takich jak skalna ściana, spędzając godziny próbując wejść z nią w interakcję, zanim w końcu znalazł sposób na jej obejście.
  • Podejmował zaskakujące decyzje w bitwie, takie jak używanie nieskutecznych ruchów lub przełączanie się na słabsze Pokémony.
  • Zapętlał się, powtarzając te same czynności w kółko, nie robiąc żadnych postępów.

Te momenty podkreślają nieodłączne wyzwania związane z opracowywaniem sztucznej inteligencji, która może naprawdę zrozumieć i wchodzić w interakcje ze złożonymi, dynamicznymi środowiskami. Chociaż Claude 3.7 Sonnet poczynił znaczne postępy w rozumowaniu i rozwiązywaniu problemów, wciąż ma długą drogę do przebycia, zanim dorówna intuicyjnemu zrozumieniu i zdolności adaptacji ludzkiego gracza.

Ukłon w stronę przeszłości: ‘Twitch Plays Pokémon’

Ten eksperyment nieuchronnie przywodzi na myśl wirusowy fenomen ‘Twitch Plays Pokémon’, który kilka lat temu urzekł internet. W tamtym eksperymencie tysiące widzów Twitcha współpracowało, aby kontrolować jedną postać w Pokémon Red, używając tekstowych poleceń na czacie. Rezultatem była chaotyczna, ale ostatecznie udana rozgrywka, napędzana zbiorową inteligencją (i okazjonalnym trollingiem) społeczności online.

Eksperyment Anthropic stanowi jednak znaczące odejście od tego modelu współpracy. Tutaj AI gra solo, próbując pokonać wyzwania gry bez żadnej interwencji człowieka. To przejście od zbiorowej rozgrywki ludzkiej do indywidualnej kontroli AI wywołało mieszane reakcje widzów. Niektórzy podziwiają postęp technologiczny, podczas gdy inni ubolewają nad utratą wspólnego doświadczenia i nieprzewidywalnego humoru, które charakteryzowały ‘Twitch Plays Pokémon’.

Szerszy obraz: Implikacje dla rozwoju AI

Poza wartością rozrywkową, eksperyment Pokémon firmy Anthropic ma szersze implikacje dla dziedziny rozwoju AI. Zapewnia cenny wgląd w mocne i słabe strony obecnych modeli AI, szczególnie w obszarach:

  • Przetwarzania języka naturalnego: Zdolność AI do rozumienia i reagowania na informacje tekstowe w grze ma kluczowe znaczenie dla jej sukcesu.
  • Uczenia się ze wzmocnieniem: AI uczy się metodą prób i błędów, stopniowo poprawiając swoją wydajność w oparciu o nagrody i kary, które otrzymuje w grze.
  • Generalizacji: Zdolność AI do stosowania tego, czego nauczyła się w jednej sytuacji, do nowych, nieznanych sytuacji jest kluczem do jej długoterminowego postępu.

Badając, jak Claude 3.7 Sonnet radzi sobie z wyzwaniami Pokémon Red, naukowcy z Anthropic mogą lepiej zrozumieć, jak opracowywać systemy AI, które są bardziej niezawodne, elastyczne i zdolne do radzenia sobie z rzeczywistymi złożonościami.

Przyszłość AI i gier

Skrzyżowanie AI i gier wideo to szybko rozwijająca się dziedzina, z potencjalnymi zastosowaniami daleko wykraczającymi poza rozrywkę. Gry zapewniają kontrolowane i mierzalne środowisko do testowania i udoskonalania algorytmów AI, a zdobyte doświadczenia można zastosować do szerokiego zakresu rzeczywistych problemów, takich jak:

  • Robotyka: Szkolenie robotów do poruszania się po złożonych środowiskach i interakcji z obiektami.
  • Pojazdy autonomiczne: Opracowywanie samochodów autonomicznych, które mogą podejmować bezpieczne i niezawodne decyzje w nieprzewidywalnych warunkach drogowych.
  • Opieka zdrowotna: Tworzenie narzędzi diagnostycznych opartych na sztucznej inteligencji i spersonalizowanych planów leczenia.
  • Edukacja: Projektowanie inteligentnych systemów korepetycji, które mogą dostosować się do indywidualnych potrzeb uczniów.

Wraz z postępem technologii AI możemy spodziewać się jeszcze bardziej wyrafinowanych i zaskakujących zastosowań AI w grach wideo i poza nimi. Eksperyment Pokémon firmy Anthropic to tylko mały krok w tej ekscytującej podróży, ale daje wgląd w potencjał AI do transformacji sposobu, w jaki żyjemy, pracujemy i bawimy się. Gra może być przeznaczona dla dzieci, ale okazuje się bardzo przydatnym narzędziem do badań nad sztuczną inteligencją. Wyzwania związane ze środowiskiem zmuszają AI do rozwijania umiejętności rozumowania i oferują wiele możliwości uczenia się. Chociaż AI jest dalekie od doskonałości, pokazało, że modele stają się coraz lepsze w rozwiązywaniu złożonych zagadek. Eksperyment przywołał wspomnienia ‘Twitch Plays Pokemon’, gdzie tysiące ludzi współpracowało. Teraz AI podejmuje te wyzwania solo, pokazując, jak daleko zaszła technologia. To duże przejście od zbiorowej rozgrywki ludzkiej do maszyny grającej i pokazuje, jak bardzo rozwija się AI.