Ahadi ya AGI
Katika nyanja inayoendelea ya akili bandia, dhana ya “akili bandia ya jumla” (AGI) imekuwa matarajio ya kuvutia. Viongozi wa sekta wanazidi kupendekeza kwamba tuko karibu na kuunda mawakala wa mtandaoni wenye uwezo wa kulinganisha, au hata kuzidi, ufahamu na utendaji wa binadamu katika anuwai ya kazi za utambuzi. Matarajio haya yamechochea mbio kati ya kampuni za teknolojia, kila moja ikijitahidi kuwa ya kwanza kufikia hatua hii muhimu.
OpenAI, mchezaji mkuu katika uwanja wa AI, anadokeza kwa hila kuwasili kwa karibu kwa wakala wa AI wa “kiwango cha PhD”. Wakala huyu, wanapendekeza, anaweza kufanya kazi kwa uhuru, akifanya kazi katika kiwango cha “mfanyakazi wa maarifa mwenye kipato cha juu.” Elon Musk, mjasiriamali mwenye malengo makubwa, ametoa utabiri wa ujasiri zaidi, akisema kwamba kuna uwezekano tutakuwa na AI “yenye akili kuliko binadamu yeyote” ifikapo mwisho wa 2025. Dario Amodei, Mkurugenzi Mtendaji wa Anthropic, kampuni nyingine maarufu ya AI, anatoa ratiba ya kihafidhina kidogo lakini anashiriki maono sawa, akipendekeza kwamba AI inaweza kuwa “bora kuliko wanadamu katika karibu kila kitu” ifikapo mwisho wa 2027.
Jaribio la Anthropic la ‘Claude Anacheza Pokémon’
Kukiwa na hali hii ya utabiri kabambe, Anthropic ilianzisha jaribio lake la ‘Claude Plays Pokémon’ mwezi uliopita. Mradi huu, uliowasilishwa kama hatua kuelekea mustakabali wa AGI uliotabiriwa, ulielezewa kama kuonyesha “mwangaza wa mifumo ya AI ambayo inakabiliana na changamoto kwa umahiri unaoongezeka, si tu kupitia mafunzo bali kwa hoja za jumla.” Anthropic ilipata umakini mkubwa kwa kuangazia jinsi “uwezo ulioboreshwa wa hoja” wa Claude 3.7 Sonnet uliwezesha mtindo wa hivi karibuni wa kampuni hiyo kufanya maendeleo katika mchezo wa kawaida wa Game Boy RPG, Pokémon, kwa njia ambazo “mifumo ya zamani ilikuwa na matumaini kidogo ya kufikia.”
Kampuni hiyo ilisisitiza kwamba “kufikiri kwa kina” kwa Claude 3.7 Sonnet kuliruhusu mtindo mpya “kupanga mapema, kukumbuka malengo yake, na kubadilika wakati mikakati ya awali inashindwa.” Hizi, Anthropic ilisema, ni “ujuzi muhimu kwa kupigana na viongozi wa gym wenye pikseli. Na, tunadai, katika kutatua matatizo ya ulimwengu halisi pia.” Maana ilikuwa wazi: Maendeleo ya Claude katika Pokémon hayakuwa tu mchezo; ilikuwa ni onyesho la uwezo unaoibuka wa AI kukabiliana na changamoto ngumu, za ulimwengu halisi.
Ukweli: Mapambano ya Claude
Hata hivyo, msisimko wa awali kuhusu utendaji wa Claude katika Pokémon umepunguzwa na kipimo cha ukweli. Ingawa Claude 3.7 Sonnet bila shaka alizidi watangulizi wake, hajafanikiwa kuumudu mchezo. Maelfu ya watazamaji kwenye Twitch wameshuhudia mapambano yanayoendelea ya Claude, wakiona makosa yake ya mara kwa mara na ukosefu wa ufanisi.
Licha ya kusitisha kwa “kufikiri” kwa kina kati ya hatua – ambapo watazamaji wanaweza kuona mchakato wa hoja wa mfumo – Claude mara nyingi hujikuta:
- Akitazama tena miji iliyokamilishwa: AI mara kwa mara hurudi kwenye maeneo ambayo tayari imeyachunguza, inaonekana bila kusudi.
- Kukwama katika pembe zisizoonekana: Claude mara nyingi hunaswa katika pembe za ramani kwa muda mrefu, akiwa hawezi kupata njia yake ya kutoka.
- Kuwasiliana mara kwa mara na NPC wasio na msaada: AI imeonekana ikijihusisha na mazungumzo yasiyo na matunda na wahusika wasio wachezaji sawa tena na tena.
Mifano hii ya utendaji wa chini wa kibinadamu katika mchezo inatoa picha iliyo mbali sana na akili kuu inayofikiriwa na wengine. Kumtazama Claude akihangaika na mchezo ulioundwa kwa ajili ya watoto, inakuwa vigumu kufikiria kwamba tunashuhudia mwanzo wa enzi mpya ya akili ya kompyuta.
Masomo kutoka kwa Utendaji wa Chini ya Binadamu
Licha ya mapungufu yake, kiwango cha sasa cha Claude cha utendaji wa Pokémon kinatoa maarifa muhimu katika harakati zinazoendelea za akili bandia ya jumla, ya kiwango cha binadamu. Hata mapambano yake yana masomo muhimu ambayo yanaweza kufahamisha juhudi za maendeleo ya baadaye.
Kwa maana, ni ajabu kwamba Claude anaweza kucheza Pokémon hata kidogo. Wakati wa kuunda mifumo ya AI kwa michezo kama Go na Dota 2, wahandisi kwa kawaida huwapa algoriti zao maarifa mengi ya sheria na mikakati ya mchezo, pamoja na kazi ya zawadi ili kuongoza ujifunzaji wao. Kinyume chake, David Hershey, msanidi programu nyuma ya mradi wa Claude Plays Pokémon, alianza na mtindo wa Claude ambao haujabadilishwa, wa jumla ambao haukuwa umefunzwa au kurekebishwa mahsusi kucheza michezo ya Pokémon.
Hershey alieleza kwa Ars, “Hii ni mambo mengine mbalimbali ambayo [Claude] anaelewa kuhusu ulimwengu yanayotumika kuelekeza kwenye michezo ya video.” Aliongeza, “Kwa hivyo ina hisia ya Pokémon. Ukienda kwa claude.ai na kuuliza kuhusu Pokémon, inajua Pokémon ni nini kulingana na kile ilichosoma… Ukiuliza, itakuambia kuna beji nane za gym, itakuambia ya kwanza ni Brock… inajua muundo mpana.”
Changamoto za Ufafanuzi wa Kuona
Mbali na kufuatilia anwani muhimu za RAM za Game Boy kwa habari za hali ya mchezo, Claude anatafsiri matokeo ya kuona ya mchezo kama vile mchezaji wa kibinadamu angefanya. Hata hivyo, licha ya maendeleo ya hivi karibuni katika usindikaji wa picha wa AI, Claude bado anajitahidi kutafsiri ulimwengu wa chini wa azimio, wa pikseli wa skrini ya Game Boy kwa usahihi sawa na binadamu.
“Claude bado si mzuri sana katika kuelewa kilicho kwenye skrini hata kidogo,” Hershey alikiri. “Utaona ikijaribu kutembea kwenye kuta kila wakati.”
Hershey anashuku kuwa data ya mafunzo ya Claude huenda haina maelezo ya kina ya maandishi ya picha zinazofanana na skrini za Game Boy. Hii inamaanisha kuwa, kwa kiasi fulani kinyume na akili, Claude anaweza kufanya vizuri zaidi na picha za kweli zaidi.
“Ni moja ya mambo ya kuchekesha kuhusu wanadamu kwamba tunaweza kutazama kwa macho madogo madogo haya ya pikseli nane kwa nane ya watu na kusema, ‘Huyo ni msichana mwenye nywele za bluu,’” Hershey alibainisha. “Watu, nadhani, wana uwezo huo wa kuchora ramani kutoka kwa ulimwengu wetu halisi ili kuelewa na aina ya kufahamu hilo… kwa hivyo nimeshangazwa sana kwamba Claude ni mzuri kama alivyo katika kuweza kuona kuna mtu kwenye skrini.”
Nguvu Tofauti, Udhaifu Tofauti
Hata kwa tafsiri kamili ya kuona, Hershey anaamini Claude bado angehangaika na changamoto za urambazaji wa 2D ambazo ni ndogo kwa wanadamu. “Ni rahisi sana kwangu kuelewa kwamba jengo [katika mchezo] ni jengo na kwamba siwezi kutembea kupitia jengo,” alisema. “Na hilo ni [jambo] ambalo ni changamoto kubwa kwa Claude kuelewa… Ni jambo la kuchekesha kwa sababu ni aina ya akili kwa njia tofauti, unajua?”
Ambapo Claude anafanya vizuri, kulingana na Hershey, ni katika vipengele vya mchezo vinavyotegemea maandishi zaidi. Wakati wa vita, Claude anaona kwa urahisi wakati mchezo unaonyesha kuwa shambulio la Pokémon wa aina ya umeme “halina ufanisi sana” dhidi ya mpinzani wa aina ya mwamba. Kisha huhifadhi habari hii katika hifadhidata yake kubwa ya maarifa iliyoandikwa kwa marejeleo ya baadaye. Claude pia anaweza kuunganisha vipande vingi vya maarifa katika mikakati ya kisasa ya vita, hata kupanua mikakati hii katika mipango ya muda mrefu ya kukamata na kusimamia timu za Pokémon.
Claude hata anaonyesha “akili” ya kushangaza wakati maandishi ya mchezo yanapotosha kwa makusudi au hayajakamilika. Hershey alitoa mfano wa kazi ya mapema ya mchezo ambapo mchezaji anaambiwa amtafute Profesa Oak karibu, lakini anagundua hayupo. “Nikiwa na umri wa miaka 5, hilo lilinichanganya sana,” Hershey alisema. “Lakini Claude kwa kawaida hupitia seti hiyo hiyo ya mienendo ambapo anazungumza na mama, anaenda kwenye maabara, hamkuti [Oak], anasema, ‘Ninahitaji kufikiria kitu’… Ni ya kisasa vya kutosha kupitia mienendo ya jinsi [wanadamu] wanavyopaswa kujifunza, pia.”
Nguvu na udhaifu huu tofauti, ikilinganishwa na uchezaji wa kiwango cha binadamu, huakisi hali ya jumla ya utafiti na uwezo wa AI, Hershey alieleza. “Nadhani ni aina ya jambo la ulimwengu wote kuhusu mifumo hii… Tulijenga upande wa maandishi kwanza, na upande wa maandishi bila shaka… una nguvu zaidi. Jinsi mifumo hii inavyoweza kufikiria kuhusu picha inazidi kuwa bora, lakini nadhani iko nyuma kidogo.”
Mipaka ya Kumbukumbu
Zaidi ya changamoto za tafsiri ya kuona na maandishi, Hershey alikiri kwamba Claude anahangaika na “kukumbuka” kile alichojifunza. Mtindo wa sasa una “dirisha la muktadha” la tokeni 200,000, ambalo linapunguza kiasi cha habari ya uhusiano ambayo inaweza kuhifadhi katika “kumbukumbu” yake wakati wowote. Wakati hifadhidata ya maarifa ya mfumo inayopanuka inajaza dirisha hili, Claude hupitia mchakato wa ufupisho wa kina, akifupisha maelezo ya kina katika muhtasari mfupi ambao bila shaka hupoteza baadhi ya maelezo madogo.
Hii inaweza kusababisha Claude “kuwa na wakati mgumu kufuatilia mambo kwa muda mrefu sana na kuwa na hisia nzuri ya kile alichojaribu hadi sasa,” Hershey alisema. “Hakika utaona mara kwa mara ikifuta kitu ambacho haikupaswa kufuta. Chochote ambacho hakiko katika hifadhidata yako ya maarifa au hakiko katika muhtasari wako kitatoweka, kwa hivyo lazima ufikirie kuhusu kile unachotaka kuweka hapo.”
Hatari za Taarifa Zisizo Sahihi
Tatizo kubwa zaidi kuliko kusahau habari muhimu ni tabia ya Claude ya kuingiza habari zisizo sahihi katika hifadhidata yake ya maarifa bila kukusudia. Kama mwananadharia wa njama anayejenga mtazamo wa ulimwengu kwa msingi mbovu, Claude anaweza kuwa mwepesi sana kutambua wakati hitilafu katika hifadhidata yake ya maarifa iliyoandikwa yenyewe inapotosha uchezaji wake wa Pokémon.
“Mambo ambayo yameandikwa hapo awali, aina ya kuyaamini kwa upofu,” Hershey alisema. “Nimeiona ikiamini sana kwamba ilipata njia ya kutoka [eneo la mchezo] Msitu wa Viridian katika viwianishi fulani, na kisha inatumia masaa na masaa kuchunguza mraba mdogo kuzunguka viwianishi hivyo ambavyo si sahihi badala ya kufanya kitu kingine chochote. Inachukua muda mrefu sana kuamua kwamba hiyo ilikuwa ‘kushindwa’.”
Licha ya changamoto hizi, Hershey alibainisha kuwa Claude 3.7 Sonnet ni bora zaidi kuliko mifumo ya awali katika “kuhoji mawazo yake, kujaribu mikakati mipya, na kufuatilia kwa muda mrefu mikakati mbalimbali ili [kuona] kama inafanya kazi au la.” Ingawa mtindo mpya bado “unahangaika kwa muda mrefu sana” kujaribu tena vitendo sawa, hatimaye huwa na “kupata hisia ya kile kinachoendelea na kile alichojaribu hapo awali, na inajikwaa mara nyingi katika maendeleo halisi kutoka kwa hilo,” Hershey alisema.
Njia ya Mbele
Moja ya vipengele vya kuvutia zaidi vya kutazama Claude Plays Pokémon katika marudio mengi, Hershey alisema, ni kuona jinsi maendeleo na mkakati wa mfumo unavyoweza kutofautiana sana kati ya mbio. Wakati mwingine, Claude anaonyesha “uwezo wake wa kujenga mkakati mzuri” kwa “kuweka maelezo ya kina kuhusu njia tofauti za kujaribu,” alieleza. Lakini “mara nyingi haifanyi hivyo… mara nyingi, hutembea ukutani kwa sababu ina uhakika inaona njia ya kutoka.”
Moja ya mapungufu makubwa ya toleo la sasa la Claude, kulingana na Hershey, ni kwamba “inapopata mkakati huo mzuri, sidhani kama ina ufahamu wa kujua kwamba mkakati mmoja [ambao] ilikuja nao ni bora kuliko mwingine.” Na hilo, alikiri, si tatizo dogo kutatua.
Hata hivyo, Hershey anaona “matunda ya chini” ya kuboresha uchezaji wa Pokémon wa Claude kwa kuboresha uelewa wa mtindo wa skrini za Game Boy. “Nadhani kuna nafasi inaweza kushinda mchezo ikiwa ingekuwa na hisia kamili ya kile kilicho kwenye skrini,” alisema, akipendekeza kwamba mtindo kama huo ungekuwa na uwezekano wa kufanya “kidogo chini ya binadamu.”
Kupanua dirisha la muktadha kwa mifumo ya baadaye ya Claude pia kuna uwezekano wa kuwawezesha “kufikiria kwa muda mrefu zaidi na kushughulikia mambo kwa usawa zaidi kwa muda mrefu,” Hershey aliongeza. Mifumo ya baadaye itaboresha kwa kupata “kidogo bora katika kukumbuka, kufuatilia seti thabiti ya kile inachohitaji kujaribu ili kufanya maendeleo,” alisema.
Ingawa matarajio ya maboresho yanayokuja katika mifumo ya AI hayapingiki, utendaji wa sasa wa Pokémon wa Claude haupendekezi kwamba iko karibu kuanzisha enzi ya akili bandia ya kiwango cha binadamu, inayoweza kutumika kwa ujumla. Hershey alikubali kwamba kumtazama Claude 3.7 Sonnet akikwama kwenye Mlima Moon kwa masaa 80 kunaweza kuifanya “ionekane kama mtindo ambao haujui unachofanya.”
Hata hivyo, Hershey bado anavutiwa na mwangaza wa mara kwa mara wa ufahamu ambao mtindo mpya wa hoja wa Claude unaonyesha, akibainisha kwamba wakati mwingine “aina ya kusema kwamba haujui unachofanya na kujua kwamba inahitaji kufanya kitu tofauti. Na tofauti kati ya ‘haiwezi kufanya kabisa’ na ‘inaweza aina ya kufanya’ ni kubwa sana kwa mambo haya ya AI kwangu,” aliendelea. “Unajua, wakati kitu kinaweza aina ya kufanya kitu kwa kawaida inamaanisha tuko karibu sana kukipata kiweze kufanya kitu vizuri sana.”