Je, ChatGPT Inaweza Kushinda Jaribio la Turing?

Kufafanua Jaribio la Turing

Kiini cha Jaribio la Turing ni rahisi sana.

Iliundwa na mwanahisabati Mwingereza Alan Turing, gwiji katika sayansi ya kompyuta, mchezo wa kuiga, kama ulivyojulikana awali, hutumika kama jaribio muhimu kwa akili ya mashine. Jaribio la Turing linahusisha mthamini wa kibinadamu anayejihusisha na mazungumzo na binadamu na mashine, bila kujua ni nani. Ikiwa mthamini hawezi kutofautisha mashine na mwanadamu, mashine inaonekana kuwa imefaulu Jaribio la Turing. Katika mazingira ya utafiti, jaribio hili hufanywa mara nyingi na wathamini tofauti.

Ni muhimu kutambua kwamba jaribio hili halithibitishi kwa hakika ikiwa LLM inamiliki kiwango sawa cha akili kama mwanadamu. Badala yake, inatathmini uwezo wa LLM kuigiza binadamu kwa ushawishi.

Mchakato wa Fikra wa LLM

LLM, kwa asili yao, hawana ubongo halisi, ufahamu, au uelewa kamili wa ulimwengu. Hawana ufahamu binafsi na hawana maoni au imani za kweli.

Miundo hii imefunzwa kwa seti kubwa za data zinazojumuisha anuwai ya vyanzo vya habari, pamoja na vitabu, nakala za mkondoni, hati, na nakala. Wakati mtumiaji anatoa ingizo la maandishi, mfumo wa akili bandia hutumia uwezo wake wa "kufikiri" ili kutambua maana na nia inayowezekana zaidi nyuma ya ingizo. Baadaye, mfumo hutoa majibu kulingana na tafsiri hii.

Msingi wake, LLM hufanya kazi kama injini za utabiri wa maneno zilizoboreshwa. Kwa kutumia data zao za mafunzo, huhesabu uwezekano wa "ishara" ya awali (kawaida neno moja) la majibu, kwa kutumia msamiati wao. Mchakato huu unaendelea hadi jibu kamili litakapoundwa. Ingawa maelezo haya yamerahisishwa, yanachukua kiini cha jinsi LLM zinazalisha majibu kulingana na uwezekano wa takwimu badala ya uelewa wa kweli wa ulimwengu.

Kwa hivyo, si sahihi kupendekeza kwamba LLM "hufikiria" kwa maana ya kawaida.

Ushahidi wa Uzoefu: ChatGPT na Jaribio la Turing

Uchunguzi mwingi umechungua utendaji wa ChatGPT kwenye Jaribio la Turing, na mengi yamezaa matokeo chanya. Hii imesababisha wanasayansi wengine wa kompyuta kudai kwamba LLM kama vile GPT-4 na GPT-4.5 sasa zimepita kikomo cha Jaribio la Turing.

Tathmini hizi nyingi huzingatia mfumo wa GPT-4 wa OpenAI, ambao unawezesha mwingiliano mwingi wa ChatGPT. Utafiti uliofanywa na UC San Diego ulifunua kuwa wathamini wa kibinadamu mara nyingi hawakuweza kutofautisha GPT-4 kutoka kwa binadamu. Katika utafiti huu, GPT-4 ilitambuliwa vibaya kama mwanadamu katika 54% ya kesi. Hata hivyo, utendaji huu bado ulikuwa nyuma ya ule wa binadamu halisi, ambao walitambuliwa kwa usahihi kama binadamu 67% ya wakati.

Baada ya kutolewa kwa GPT-4.5, watafiti wa UC San Diego walirudia utafiti. Wakati huu, LLM ilitambuliwa kama mwanadamu katika 73% ya kesi, ikizidi utendaji wa binadamu halisi. Utafiti pia ulionyesha kuwa LLaMa-3.1-405B ya Meta ilikuwa na uwezo wa kufaulu jaribio.

Utafiti sawa uliofanywa kwa kujitegemea kutoka UC San Diego pia umetoa alama za kupita kwa GPT. Utafiti wa 2024 na Chuo Kikuu cha Reading ulihusisha GPT-4 ikitoa majibu ya tathmini za kuchukua nyumbani kwa kozi za shahada ya kwanza. Watoa alama hawakufahamu jaribio na walitoa bendera moja tu kati ya maoni 33. ChatGPT ilipokea alama za juu ya wastani kwa maingizo 32 yaliyobaki.

Je, tafiti hizi zina hitimisho? Si kabisa. Baadhi ya wakosoaji wanasema kuwa matokeo haya ya utafiti hayaonekani kuvutia kama yanavyoonekana. Mashaka haya yanatuzuia kutangaza kwa uhakika kwamba ChatGPT imefaulu Jaribio la Turing.

Hata hivyo, ni wazi kwamba wakati vizazi vilivyopita vya LLM, kama vile GPT-4, vilifaulu Jaribio la Turing mara kwa mara, matokeo yenye mafanikio yanazidi kuenea kadiri LLM zinavyoendelea kusonga mbele. Pamoja na kuibuka kwa mifumo ya kisasa kama vile GPT-4.5, tunakaribia kwa haraka mahali ambapo mifumo inaweza kufaulu Jaribio la Turing mara kwa mara.

OpenAI inatabiri siku zijazo ambapo kutofautisha kati ya binadamu na akili bandia haiwezekani. Maono haya yanaonekana katika uwekezaji wa Mkurugenzi Mkuu wa OpenAI Sam Altman katika mradi wa uthibitishaji wa binadamu unaohusisha kifaa cha uchunguzi wa mboni kinachojulikana kama The Orb.

Tathmini Binafsi ya ChatGPT

Alipoulizwa ikiwa inaweza kufaulu Jaribio la Turing, ChatGPT ilijibu kwa uthibitisho, ingawa kwa masharti ambayo tayari yamejadiliwa. Alipoulizwa swali, "Je, ChatGPT inaweza kufaulu Jaribio la Turing?" chatbot ya akili bandia (kwa kutumia mfumo wa 4o) ilisema kwamba "ChatGPT inaweza kufaulu Jaribio la Turing katika baadhi ya matukio, lakini si kwa uhakika au ulimwenguni." Chatbot ilihitimisha kuwa "Inaweza kufaulu Jaribio la Turing na mtumiaji wa wastani katika hali za kawaida, lakini mhoji anayeazimia na mwenye mawazo angeweza karibu kila mara kuifichua."

Mapungufu ya Jaribio la Turing

Wanasayansi wengine wa kompyuta sasa wanaona Jaribio la Turing kuwa limepitwa na wakati na la thamani ndogo katika kutathmini LLM. Gary Marcus, mwanasaikolojia wa Kimarekani, mwanasayansi wa utambuzi, mwandishi, na mtoa maoni wa akili bandia, alielezea kwa ufupi mtazamo huu katika chapisho la hivi majuzi la blogu, akisema kwamba "kama mimi (na wengine wengi) nimesema kwa miaka, Jaribio la Turing ni jaribio la udanganyifu wa binadamu, si jaribio la akili."

Pia ni muhimu kukumbuka kuwa Jaribio la Turing linazingatia mtazamo wa akili badala ya akili halisi. Tofauti hii ni muhimu. Mfumo kama vile ChatGPT 4o unaweza kufaulu jaribio kwa kuiga tu hotuba ya binadamu. Zaidi ya hayo, mafanikio ya LLM kwenye jaribio yatategemea mada ya majadiliano na mthamini. ChatGPT inaweza kufanikiwa katika mazungumzo ya kawaida lakini ikatatizika na mwingiliano unaohitaji akili halisi ya kihisia. Zaidi ya hayo, mifumo ya kisasa ya akili bandia inazidi kutumika kwa matumizi zaidi ya mazungumzo rahisi, haswa tunapoelekea ulimwengu wa akili bandia yenye ushawishi.

Hii haimaanishi kuwa Jaribio la Turing halina umuhimu kabisa. Inabakia kuwa alama muhimu ya kihistoria, na ni muhimu kwamba LLM zina uwezo wa kulifaulu. Hata hivyo, Jaribio la Turing si kipimo cha mwisho cha akili ya mashine.

Zaidi ya Jaribio la Turing: Kutafuta Alama Bora

Jaribio la Turing, ingawa ni muhimu kihistoria, linaonekana kuwa kipimo kisichotosha cha akili bandia ya kweli. Mtazamo wake juu ya kuiga mazungumzo ya kibinadamu unakosa vipengele muhimu vya akili, kama vile utatuzi wa matatizo, ubunifu, na uwezo wa kubadilika. Utegemezi wa jaribio kwenye udanganyifu pia unazua wasiwasi wa kimaadili, kwani unahimiza mifumo ya akili bandia kujifanya sifa za kibinadamu badala ya kuendeleza akili halisi.

Haja ya Vipimo Vipya

Kadiri teknolojia ya akili bandia inavyoendelea, haja ya alama kamili zaidi na muhimu inazidi kuonekana. Vipimo hivi vipya vinapaswa kushughulikia mapungufu ya Jaribio la Turing na kutoa tathmini sahihi zaidi ya uwezo wa akili bandia. Baadhi ya mwelekeo unaowezekana wa alama za siku zijazo ni pamoja na:

  • Ushughulikiaji wa matatizo halisi: Majaribio ambayo yanahitaji mifumo ya akili bandia kutatua matatizo magumu halisi, kama vile kubuni gridi endelevu ya nishati au kuendeleza tiba ya ugonjwa.
  • Kazi za ubunifu: Tathmini ambazo zinatathmini uwezo wa akili bandia kutoa maudhui asili na ya ubunifu, kama vile kuandika riwaya, kutunga muziki, au kuunda sanaa.
  • Uwezo wa kubadilika na kujifunza: Vipimo ambavyo hupima uwezo wa akili bandia kujifunza kutoka kwa uzoefu mpya na kuzoea mazingira yanayobadilika.
  • Mazingatio ya kimaadili: Tathmini ambazo zinatathmini uwezo wa akili bandia kufanya maamuzi ya kimaadili na kuepuka upendeleo.

Mifano ya Alama Zinazojitokeza

Alama kadhaa mpya zinajitokeza kushughulikia mapungufu ya Jaribio la Turing. Hizi ni pamoja na:

  • Changamoto ya Schema ya Winograd: Jaribio hili linazingatia uwezo wa akili bandia kuelewa viwakilishi visivyo wazi katika sentensi.
  • Changamoto ya Akili ya AI2: Alama hii inatathmini uwezo wa akili bandia kufikiri na kujibu maswali kulingana na maandishi magumu.
  • Changamoto ya Ushughulikiaji wa Akili: Jaribio hili linatathmini uelewa wa akili bandia wa maarifa ya kawaida na uwezo wake wa kufanya hitimisho.

Mustakabali wa Tathmini ya Akili Bandia

Mustakabali wa tathmini ya akili bandia uwezekano mkubwa utahusisha mchanganyiko wa alama tofauti, kila moja imeundwa kutathmini vipengele maalum vya akili. Alama hizi zinapaswa kuwa zinabadilika kila mara ili kuendana na maendeleo ya haraka katika teknolojia ya akili bandia. Zaidi ya hayo, ni muhimu kuhusisha wadau mbalimbali, pamoja na watafiti, watunga sera, na umma, katika maendeleo na tathmini ya alama za akili bandia.

Kuvuka Uigaji

Hatimaye, lengo la utafiti wa akili bandia linapaswa kuwa kuendeleza mifumo ambayo si akili tu bali pia yenye manufaa kwa ubinadamu. Hii inahitaji kuvuka harakati za uigaji kama binadamu na kuzingatia kuendeleza mifumo ya akili bandia ambayo inaweza kutatua matatizo halisi, kuongeza ubunifu, na kukuza maamuzi ya kimaadili. Kwa kukumbatia alama mpya na kuzingatia malengo haya mapana, tunaweza kufungua uwezo kamili wa akili bandia na kuunda mustakabali ambapo akili bandia na wanadamu hufanya kazi pamoja kuunda ulimwengu bora.