Anthropic's Claude Pokémon'u Neden Geçemedi?

AGI’nin Vaadi

Yapay zekanın hızla gelişen alanında, ‘yapay genel zeka’ (AGI) kavramı heyecan verici bir olasılık haline geldi. Sektör liderleri, giderek artan bir şekilde, çok çeşitli bilişsel görevlerde insan anlayışını ve performansını eşleştirebilen, hatta aşabilen sanal aracılar yaratmanın eşiğinde olduğumuzu öne sürüyorlar. Bu beklenti, teknoloji şirketleri arasında, her birinin bu çığır açan kilometre taşına ilk ulaşan olmak için çabaladığı bir yarışı körükledi.

OpenAI, AI alanında önemli bir oyuncu, ‘doktora düzeyinde’ bir AI aracısının yakında geleceğine dair ince ipuçları veriyor. Bu aracının, özerk bir şekilde çalışabileceğini ve ‘yüksek gelirli bir bilgi çalışanı’ düzeyinde performans gösterebileceğini öne sürüyorlar. Her zaman hırslı bir girişimci olan Elon Musk, daha da cesur tahminlerde bulundu ve 2025’in sonuna kadar ‘herhangi bir insandan daha zeki’ bir yapay zekaya sahip olacağımızı belirtti. Bir diğer önde gelen AI şirketi olan Anthropic’in CEO’su Dario Amodei, biraz daha muhafazakar bir zaman çizelgesi sunuyor, ancak benzer bir vizyon paylaşıyor ve AI’nin 2027’nin sonuna kadar ‘neredeyse her şeyde insanlardan daha iyi’ olabileceğini öne sürüyor.

Anthropic’in ‘Claude Plays Pokémon’ Deneyi

Bu iddialı tahminlerin ortasında, Anthropic geçen ay ‘Claude Plays Pokémon’ deneyini tanıttı. Öngörülen AGI geleceğine doğru bir adım olarak sunulan bu proje, ‘AI sistemlerinin zorlukları yalnızca eğitimle değil, genelleştirilmiş akıl yürütmeyle artan yetkinlikle ele aldığına dair parıltılar’ sergilediği şeklinde tanımlandı. Anthropic, Claude 3.7 Sonnet’in ‘gelişmiş akıl yürütme yeteneklerinin’, şirketin en son modelinin klasik Game Boy RPG’si Pokémon‘da, ‘eski modellerin başarma umudu çok az olan’ şekillerde ilerleme kaydetmesini nasıl sağladığını vurgulayarak önemli ölçüde dikkat çekti.

Şirket, Claude 3.7 Sonnet’in ‘genişletilmiş düşüncesinin’, yeni modelin ‘ileriye dönük plan yapmasına, hedeflerini hatırlamasına ve ilk stratejiler başarısız olduğunda uyum sağlamasına’ olanak tanıdığını vurguladı. Anthropic, bunların ‘pikselli spor salonu liderleriyle savaşmak için kritik beceriler olduğunu ve gerçek dünya problemlerini çözmede de önemli olduğunu’ savundu. Çıkarım açıktı: Claude’un Pokémon‘daki ilerlemesi sadece bir oyun değildi; AI’nin karmaşık, gerçek dünya zorluklarını ele alma konusundaki gelişen yeteneğinin bir göstergesiydi.

Gerçeklik Kontrolü: Claude’un Mücadeleleri

Ancak, Claude’un Pokémon performansı etrafındaki ilk heyecan, bir doz gerçeklikle yumuşatıldı. Claude 3.7 Sonnet, şüphesiz öncekilerden daha iyi performans gösterse de, oyunda ustalık elde etmedi. Twitch’teki binlerce izleyici, Claude’un devam eden mücadelelerine tanık oldu, sık sık yaptığı yanlış adımları ve verimsizlikleri gözlemledi.

Hamleler arasında uzatılmış ‘düşünme’ duraklamalarına rağmen – bu sırada izleyiciler sistemin simüle edilmiş akıl yürütme sürecini gözlemleyebilir – Claude sık sık kendini şu durumlarda bulur:

  • Tamamlanmış kasabaları tekrar ziyaret etmek: AI, görünüşte bir amacı olmadan, daha önce keşfettiği alanlara sık sık geri döner.
  • Kör köşelerde sıkışıp kalmak: Claude, haritanın köşelerinde uzun süre sıkışıp kalır ve yolunu bulamaz.
  • Yardımcı olmayan NPC’lerle tekrar tekrar etkileşim kurmak: AI’nin aynı oyuncu olmayan karakterlerle tekrar tekrar sonuçsuz konuşmalar yaptığı gözlemlenmiştir.

İnsan altı oyun performansının bu örnekleri, bazılarının öngördüğü süper zekadan çok uzak bir tablo çiziyor. Claude’un çocuklar için tasarlanmış bir oyunla mücadelesini izlerken, yeni bir bilgisayar zekası çağının şafağına tanık olduğumuzu hayal etmek zorlaşıyor.

İnsan Altı Performanstan Alınacak Dersler

Eksikliklerine rağmen, Claude’un mevcut Pokémon performansı seviyesi, genelleştirilmiş, insan seviyesinde yapay zeka arayışına dair değerli bilgiler sunuyor. Mücadeleleri bile, gelecekteki geliştirme çabalarına bilgi sağlayabilecek önemli dersler barındırıyor.

Bir anlamda, Claude’un Pokémon oynayabilmesi bile dikkate değer. Go ve Dota 2 gibi oyunlar için AI sistemleri geliştirirken, mühendisler tipik olarak algoritmalarına oyunun kuralları ve stratejileri hakkında kapsamlı bilgi ve öğrenmelerine rehberlik edecek bir ödül işlevi sağlar. Buna karşılık, Claude Plays Pokémon projesinin arkasındaki geliştirici David Hershey, Pokémon oyunlarını oynamak için özel olarak eğitilmemiş veya ayarlanmamış, değiştirilmemiş, genelleştirilmiş bir Claude modeliyle başladı.

Hershey, Ars’a şunları açıkladı: ‘Bu, tamamen [Claude’un] dünya hakkında anladığı diğer şeylerin video oyunlarına işaret etmek için kullanılmasıdır.’ Şöyle ekledi: ‘Yani bir Pokémon hissi var. claude.ai’ye gidip Pokémon hakkında sorarsanız, okuduklarına dayanarak Pokémon’un ne olduğunu bilir… Sorarsanız, size sekiz spor salonu rozeti olduğunu, ilkinin Brock olduğunu söyler… genel yapıyı bilir.’

Görsel Yorumlamanın Zorlukları

Oyun durumu bilgileri için anahtar Game Boy RAM adreslerini izlemenin yanı sıra, Claude oyunun görsel çıktısını bir insan oyuncu gibi yorumlar. Ancak, AI görüntü işlemedeki son gelişmelere rağmen, Claude hala bir Game Boy ekran görüntüsünün düşük çözünürlüklü, pikselli dünyasını bir insanla aynı doğrulukta yorumlamakta zorlanıyor.

Hershey, ‘Claude hala ekranda ne olduğunu anlamakta pek iyi değil,’ diye itiraf etti. ‘Onun sürekli duvarlara yürümeye çalıştığını göreceksiniz.’

Hershey, Claude’un eğitim verilerinin Game Boy ekranlarına benzeyen görüntülerin ayrıntılı metin açıklamalarından yoksun olduğundan şüpheleniyor. Bu, biraz mantığa aykırı olarak, Claude’un aslında daha gerçekçi görüntülerle daha iyi performans gösterebileceği anlamına geliyor.

Hershey, ‘İnsanların sekiz-sekiz piksellik insan yığınlarına şaşı bakıp ‘Bu mavi saçlı bir kız’ diyebilmesi komik bir şey,’ dedi. ‘İnsanların, sanırım, gerçek dünyamızdan eşleme ve anlama yeteneği var… bu yüzden Claude’un ekranda bir kişi olduğunu görebilme konusunda bu kadar iyi olmasına şaşırdım.’

Farklı Güçlü Yönler, Farklı Zayıf Yönler

Mükemmel görsel yorumlamayla bile, Hershey, Claude’un insanlar için önemsiz olan 2B navigasyon zorluklarıyla hala mücadele edeceğine inanıyor. ‘[Oyun içi] bir binanın bir bina olduğunu ve bir binanın içinden geçemeyeceğimi anlamak benim için oldukça kolay,’ dedi. ‘Ve bu, Claude’un anlaması oldukça zor olan bir şey… Komik çünkü farklı şekillerde zeki, biliyor musun?’

Hershey’e göre, Claude’un üstün olduğu yer, oyunun daha çok metin tabanlı yönleri. Savaşlar sırasında, Claude, oyunun bir elektrik tipi Pokémon’un saldırısının bir kaya tipi rakibe karşı ‘çok etkili olmadığını’ gösterdiğini hemen fark eder. Daha sonra bu bilgiyi, gelecekte başvurmak üzere geniş yazılı bilgi tabanında saklar. Claude ayrıca, birden fazla bilgi parçasını karmaşık savaş stratejilerine entegre edebilir, hatta bu stratejileri Pokémon yakalama ve yönetme ekipleri için uzun vadeli planlara genişletebilir.

Claude, oyunun metni kasıtlı olarak yanıltıcı veya eksik olduğunda bile şaşırtıcı bir ‘zeka’ gösterir. Hershey, oyuncuya Profesör Oak’ı yan tarafta bulması söylendiği, ancak orada olmadığını keşfettiği erken bir oyun görevini örnek gösterdi. ‘5 yaşında bir çocuk olarak, bu benim için çok kafa karıştırıcıydı,’ dedi Hershey. ‘Ancak Claude aslında tipik olarak annemle konuşur, laboratuvara gider, [Oak’ı] bulamaz, ‘Bir şeyler bulmam gerekiyor’ der… İnsanların aslında onu öğrenmesi gereken şekilde hareket edecek kadar sofistike.’

İnsan seviyesindeki oyunla karşılaştırıldığında bu zıt güçlü ve zayıf yönler, AI araştırmasının ve yeteneklerinin genel durumunu yansıtıyor, diye açıkladı Hershey. ‘Bence bu modeller hakkında evrensel bir şey… Önce metin tarafını inşa ettik ve metin tarafı kesinlikle… daha güçlü. Bu modellerin görüntüleri nasıl yorumlayabildiği gelişiyor, ancak bence metin tarafının biraz gerisinde.’

Hafızanın Sınırları

Görsel ve metinsel yorumlamayla ilgili zorlukların ötesinde, Hershey, Claude’un öğrendiklerini ‘hatırlamakta’ zorlandığını kabul etti. Mevcut modelin 200.000 belirteçlik bir ‘bağlam penceresi’ vardır, bu da herhangi bir zamanda ‘hafızasında’ saklayabileceği ilişkisel bilgi miktarını sınırlar. Sistemin genişleyen bilgi tabanı bu pencereyi doldurduğunda, Claude ayrıntılı notları kaçınılmaz olarak bazı ince ayrıntıları kaybeden daha kısa özetlere yoğunlaştıran ayrıntılı bir özetleme sürecinden geçer.

Bu, Claude’un ‘çok uzun süre bir şeyleri takip etmekte zorlanmasına ve şimdiye kadar ne denediğine dair harika bir fikir sahibi olmasına’ yol açabilir, dedi Hershey. ‘Kesinlikle ara sıra silmemesi gereken bir şeyi sildiğini göreceksiniz. Bilgi tabanınızda veya özetinizde olmayan her şey kaybolacak, bu yüzden oraya ne koymak istediğinizi düşünmeniz gerekiyor.’

Yanlış Bilginin Tehlikeleri

Önemli bilgileri unutmaktan daha sorunlu olan şey, Claude’un yanlışlıkla bilgi tabanına yanlış bilgi ekleme eğilimidir. Dünya görüşünü kusurlu bir önermeye dayandıran bir komplo teorisyeni gibi, Claude, kendi yazdığı bilgi tabanındaki bir hatanın Pokémon oyununu yanlış yönlendirdiğini fark etmekte oldukça yavaş olabilir.

Hershey, ‘Geçmişte yazılan şeylere, bir nevi körü körüne güveniyor,’ dedi. ‘[Oyun içi konum] Viridian Ormanı’nın çıkışını belirli koordinatlarda bulduğuna çok ikna olduğunu ve ardından saatlerce yanlış olan bu koordinatların etrafındaki küçük bir kareyi keşfederek başka bir şey yapmadan geçirdiğini gördüm. Bunun bir ‘başarısızlık’ olduğuna karar vermesi çok uzun zaman alıyor.’

Bu zorluklara rağmen, Hershey, Claude 3.7 Sonnet’in önceki modellere göre ‘varsayımlarını sorgulama, yeni stratejiler deneme ve çeşitli stratejilerin işe yarayıp yaramadığını görmek için uzun ufuklar boyunca takip etme’ konusunda önemli ölçüde daha iyi olduğunu belirtti. Yeni model hala aynı eylemleri tekrar tekrar deneyerek ‘gerçekten uzun süre mücadele etse’ de, sonuçta ‘neler olup bittiğine ve daha önce ne denediğine dair bir fikir edinme’ eğiliminde olduğunu ve ‘çoğu zaman gerçek ilerlemeye tökezlediğini’ söyledi Hershey.

İleriye Doğru Yol

Hershey, Claude Plays Pokémon‘u birden fazla yinelemede gözlemlemenin en büyüleyici yönlerinden birinin, sistemin ilerlemesinin ve stratejisinin çalıştırmalar arasında önemli ölçüde nasıl değişebileceğini görmek olduğunu söyledi. Bazen Claude, ‘denenecek farklı yollar hakkında ayrıntılı notlar tutarak’ ‘aslında oldukça tutarlı bir strateji oluşturabildiğini’ gösteriyor, diye açıkladı. Ancak ‘çoğu zaman yapmıyor… çoğu zaman, çıkışı gördüğünden emin olduğu için duvara doğru yürüyor.’

Hershey’e göre, Claude’un mevcut sürümünün en büyük sınırlamalarından biri, ‘bu iyi stratejiyi türettiğinde, bulduğu bir stratejinin diğerinden daha iyi olduğunu bilmek için mutlaka öz farkındalığa sahip olduğunu düşünmüyorum.’ Ve bunun çözülmesi önemsiz bir sorun olmadığını kabul etti.

Bununla birlikte, Hershey, Claude’un Pokémon oyununu iyileştirmek için modelin Game Boy ekran görüntülerine ilişkin anlayışını geliştirerek ‘kolayca ulaşılabilecek hedefler’ görüyor. ‘Ekranda ne olduğunu mükemmel bir şekilde anlasaydı oyunu kazanma şansı olduğunu düşünüyorum,’ dedi ve böyle bir modelin muhtemelen ‘insandan biraz daha düşük’ performans göstereceğini öne sürdü.

Gelecekteki Claude modelleri için bağlam penceresini genişletmek, muhtemelen onların ‘daha uzun zaman dilimleri boyunca akıl yürütmelerini ve işleri uzun bir süre boyunca daha tutarlı bir şekilde ele almalarını’ sağlayacaktır, diye ekledi Hershey. Gelecekteki modeller, ‘hatırlamada, ilerleme kaydetmek için denemesi gereken tutarlı bir kümeyi takip etmede biraz daha iyi’ olarak gelişecektir, dedi.

AI modellerinde yaklaşan iyileştirmeler olasılığı inkar edilemez olsa da, Claude’un mevcut Pokémon performansı, insan seviyesinde, tamamen genelleştirilebilir yapay zeka çağını başlatmanın eşiğinde olduğunu göstermiyor. Hershey, Claude 3.7 Sonnet’in Mt. Moon’da 80 saat boyunca takılıp kalmasını izlemenin, ‘ne yaptığını bilmeyen bir model gibi görünmesine’ neden olabileceğini kabul etti.

Ancak Hershey, Claude’un yeni akıl yürütme modelinin gösterdiği ara sıra farkındalık parıltılarından etkilenmeye devam ediyor ve bazen ‘ne yaptığını bilmediğini ve farklı bir şey yapması gerektiğini bildiğini’ söyleyeceğini belirtiyor. Ve ‘hiç yapamamak’ ile ‘biraz yapabilmek’ arasındaki fark, benim için bu AI şeyleri için oldukça büyük,’ diye devam etti. ‘Biliyorsunuz, bir şey bir şeyi biraz yapabildiğinde, bu genellikle onu gerçekten çok iyi yapabilmeye oldukça yakın olduğumuz anlamına gelir.’