Ndani ya Mradi Xylophone: Kuunda Akili Bandia ya Mazungumzo
Hati zilizovuja zimefichua utendaji wa ndani wa Mradi Xylophone, mpango wa Scale AI ulioundwa kuboresha mifumo ya sauti ya xAI. Mradi huo unahusu kuwashirikisha wakandarasi kujirekodi wakiboresha mazungumzo juu ya mada anuwai. Lengo kuu ni kuingiza mifumo ya xAI na ubora wa asili zaidi, kama wa kibinadamu, kuondoka kwenye sauti ya roboti ambayo mara nyingi huonyesha mwingiliano wa AI.
Wakandarasi hawa, wanaopatikana na kampuni ya kuweka lebo ya data Scale AI, wanalipwa kwa kurekodi mazungumzo na wenzao juu ya mada kuanzia ya kawaida hadi ya ubunifu, yote kwa huduma ya kufanya mifumo ya sauti ya xAI isikike ya kweli zaidi. Kufikia Aprili, Scale AI ilikuwa ikisimamia angalau miradi 10 ya uzalishaji wa AI kwa xAI, kuonyesha juhudi kubwa inayomiminwa katika eneo hili.
Msukumo wa tasnia nzima kwa AI ya mazungumzo zaidi hutoka kwa hamu ya kuvutia watumiaji kwa matoleo ya malipo, ya kulipwa ya huduma hizi. Kwa kufanya mwingiliano wa AI uwe wa kufurahisha zaidi na wa asili, kampuni zinatarajia kuwashawishi watumiaji kuwekeza katika teknolojia hizi za hali ya juu.
Mpango wa Mafunzo ya Mazungumzo
Business Insider ilipata mfululizo wa hati za Scale AI ambazo hutoa mwonekano wa kina wa jinsi Mradi Xylophone unavyofanya kazi. Hati hizi, pamoja na maagizo ya mradi, miongozo ya wakaguzi, na miongozo ya mada ya mazungumzo, hutoa muhtasari kamili wa mbinu ya mradi.
Wakati mfumo maalum wa xAI unaofunzwa unabaki haujafichuliwa katika hati, umakini wa mradi kwenye "ubora wa sauti na ufasaha wa asili" unaonyesha msisitizo mkubwa katika kuunda uzoefu wa mtumiaji usio na mshono na unaovutia. Wakandarasi walio na uzoefu wa uigizaji wa sauti wanahimizwa sana kushiriki, kuonyesha umuhimu wa utendaji wa sauti katika kufikia kiwango kinachohitajika cha uhalisia.
Mradi Xylophone umeundwa karibu na vipengele viwili vya msingi: "Mazungumzo" na "Malisho". Sehemu ya "Mazungumzo" inahusisha timu za wakandarasi watatu wanaoshiriki katika mazungumzo ya kweli kupitia Zoom. Mazungumzo haya yanaongozwa na jedwali lililo na mamia ya vidokezo, vinavyoshughulikia mada mbalimbali, kutoka kwa mbinu za kuishi katika ulimwengu wa baada ya apocalypse hadi kudhibiti wasiwasi na kupanga safari za kimataifa.
Kuingia Kina katika Vidokezo vya Mazungumzo: Mtazamo wa Mawazo ya AI
Vidokezo vya mazungumzo vilivyoajiriwa katika Mradi Xylophone vinatoa mtazamo wa kuvutia katika aina ya matukio na mada ambazo mifumo ya AI inafunzwa kushughulikia. Vidokezo vinatoka kwa vitendo hadi vya kifalsafa, na hata huingia katika ulimwengu wa sayansi.
Hapa kuna mifano michache ya vianzilishi vya mazungumzo vilivyotumika katika hati za Scale AI:
- Ikiwa ungekuwa unaandaa 'utamaduni' kwa makazi ya kwanza ya Mars, ni mila gani ya Dunia ambayo hakika ungetaka kuunda upya, na ungefurahi kuacha nini milele?
- 'Mhalifu' gani katika maisha yako ya kila siku unatamani timu ya mashujaa iweze kuingia na kurekebisha kwa kila mtu?
- Ikiwa apocalypse ya zombie ingepiga kesho, ni kitu gani cha kwanza ungechukua kutoka kwa nyumba yako kabla ya kukimbia?
- Fikiria wewe ni mwanasaikolojia wa misheni kwa koloni ya Mars - ni aina gani ya utu au tabia ya kipekee ambayo ungetarajia kupata kwa siri katika wakoloni wenzako?
- Ni janga gani la kukumbukwa zaidi la mabomba ambalo umewahi kupata kama mmiliki wa nyumba—na ulijaribu kulirekebisha mwenyewe au mara moja uliita msaada?
- Unakumbuka mara ya kwanza ilibidi uombe pesa zaidi au faida bora? Nini kilikuwa kinaenda akilini mwako?
Vidokezo hivi vimeundwa ili kutoa majibu ya asili, yasiyoandikwa kutoka kwa wakandarasi, ambayo yanaweza kutumika kufunza mifumo ya AI kushughulikia aina mbalimbali za matukio ya mazungumzo.
Maagizo ya mazungumzo "mazuri" yanasisitiza umuhimu wa kusikika asili na kihemko, na matamshi tofauti na usumbufu. Lengo ni kuiga ubadhirifu na kutotabirika kwa mazungumzo ya kweli ya kibinadamu.
Mbinu ya Malisho: Isiyoandikwa na Halisi
Tofauti na sehemu iliyoandaliwa ya "Mazungumzo", sehemu ya "Malisho" inazingatia wafanyikazi wa pekee kuunda rekodi zisizoandikwa, zinazosikika asili katika lugha zao za asili. Wafanyikazi hawa hupewa aina ya mazungumzo na kitengo kidogo na wanahimizwa kuruhusu mazungumzo yatiririke kwa uhuru, na kelele za usuli hata zikihimizwa.
Sehemu ya "Malisho" inajumuisha makundi madogo kadhaa, pamoja na "uulizaji wa Kisocratiki", "usimulizi wa hadithi za kutafakari", "matukio ya upendo wa kortini", "makabiliano ya shujaa-mhalifu", na "utatuzi wa mafumbo wa ushirikiano." Makundi madogo haya mara nyingi yanahusisha mahitaji maalum, kama vile lafudhi tofauti, athari za sauti, au mifumo ya lugha iliyogunduliwa.
Mbinu ya "Malisho" inaonyesha hamu ya kukamata nuances na ugumu wa mazungumzo ya kibinadamu kwa njia halisi zaidi na isiyozuiliwa.
Uchumi wa Mafunzo ya AI: Mtazamo wa Fidia
Wakandarasi wa Scale AI waliohusika katika Mradi Xylophone wanapata fidia kwa michango yao, kuangazia kipengele cha kiuchumi cha mafunzo ya AI. Kulingana na ripoti, wakandarasi hulipwa dola chache kwa kila kazi kwa kazi yao.
Muundo wa malipo kwa mradi wa "Malisho" uliripotiwa kuanza kwa $3 kwa kila kazi lakini baadaye ulipunguzwa hadi $1 kwa kila kazi. Kila kazi inahusisha kurekodi faili ya sauti, ambayo wakandarasi huipakia kwenye jukwaa la Scale AI na kuinakili kwa mikono.
Viwango vya chini vya malipo vinasisitiza kazi isiyoonekana mara nyingi ambayo huenda katika kuunda na kufunza mifumo ya AI.
Umuhimu wa Ubora wa Data: Kukamata Nuances ya Hotuba ya Binadamu
Mafanikio ya mifumo ya sauti ya AI yanategemea upatikanaji wa idadi kubwa ya data ya ubora wa juu. Mradi Xylophone unaonyesha juhudi za kutoa data inayofaa kwa kuunda upya matukio ya ulimwengu halisi, kama vile mazungumzo ya kawaida kati ya watu.
Hati ya "Malisho" inawaagiza wakandarasi waziwazi kujumuisha maneno ya kujaza kama vile "uh" katika nakala zao. Mtazamo huu kwa undani unasistiza umuhimu wa kukamata nuances hila ya hotuba ya binadamu, pamoja na kusitisha, kusita, na vidokezo vingine visivyo vya maneno.
Kwa kuingiza vipengele hivi kwenye data ya mafunzo, mifumo ya AI inaweza kujifunza kutoa mazungumzo ya asili zaidi na yanayovutia.
Kuingiza Utu katika AI: Makali ya Ushindani
Mradi Xylophone ni sehemu ya mwelekeo mpana kati ya kampuni za AI kuingiza utu katika mifumo yao ya AI, kutafuta kujitofautisha katika soko lenye watu wengi.
Meta, kwa mfano, inaripotiwa kuendesha mradi kupitia Scale AI akiuliza wafanyakazi wa gig wanaofunza AI yake kupitisha tabia tofauti, kama vile “mchawi mwenye hekima na wa ajabu” au “mwanafunzi wa nadharia ya muziki mwenye msisimko mwingi.”
Sam Altman wa OpenAI alikiri kwamba GPT-4o ya hivi karibuni ilikuwa ime "kuwa mnyonge sana na ya kukera," na kusababisha kuwekwa upya ili kufanya majibu yake yawe ya asili zaidi.
Juhudi hizi zinaonyesha utambuzi kwamba mifumo ya AI inahitaji kuwa zaidi ya akili tu - pia zinahitaji kupendwa na kuhusiana.
Vipimo vya Kimaadili vya Mafunzo ya AI: Kusawazisha Usahihi na Upendeleo
Kadiri mifumo ya AI inavyozidi kuwa ya kisasa, wasiwasi juu ya upendeleo na masuala ya kimaadili yamekua, na kuzua mijadala juu ya maendeleo ya AI yenye uwajibikaji.
xAI imeuza Grok kama chatbot ya kisiasa zaidi ikilinganishwa na kile Musk ameiita wapinzani "wameamka", na mbinu za mafunzo ambazo wakati mwingine zinaelemea sana maoni ya mrengo wa kulia au ya kupinga.
xAI pia imeongeza juhudi zake za kudhibiti upande usiotabirika wa Grok. Wafanyakazi wapya wana "timu nyekundu" Grok, wakiipima dhiki kwa majibu yasiyo salama au yanayokiuka sera, haswa juu ya mada zenye utata na katika njia za "NSFW" au "zilizofungwa."
Juhudi hizi zinaonyesha changamoto za kuunda mifumo ya AI ambayo ni ya kuelimisha na ya kimaadili, na hitaji la ufuatiliaji na tathmini inayoendelea.
Mageuzi Yanayoendelea ya Mifumo ya Sauti ya AI: Mustakabali wa Mwingiliano Usio na Mshono
Mradi Xylophone na mipango sawa inawakilisha hatua muhimu mbele katika jitihada za kuunda mifumo ya sauti ya AI ambayo inaweza kuingiliana na wanadamu kwa urahisi. Teknolojia ya AI inavyoendelea kubadilika, tunaweza kutarajia kuona wasaidizi wa AI wa kisasa zaidi na wanaosikika asili katika siku zijazo.
Utafutaji wa mifumo ya sauti ya AI kama ya kibinadamu sio bila changamoto zake. Wasiwasi juu ya upendeleo, masuala ya kimaadili, na uwezekano wa matumizi mabaya yanabaki. Walakini, faida zinazoweza kupatikana za teknolojia hizi ni kubwa, kutoka kwa kuboresha ufikiaji hadi kuimarisha mawasiliano na ushirikiano.
Kadiri mifumo ya sauti ya AI inavyozidi kuenea, itakuwa muhimu kushughulikia changamoto hizi kwa makini na kuhakikisha kuwa teknolojia hizi zinatumiwa kwa uwajibikaji na kimaadili. Mustakabali wa mifumo ya sauti ya AI una ahadi kubwa, lakini ni juu yetu kuunda mustakabali huo kwa njia ambayo inanufaisha ubinadamu wote.
Juhudi za kuunda AI inayosema kama binadamu ni ngumu, kama inavyothibitishwa katika hati zilizovuja. Sio lazima tu AI izungumze kwa ufasaha na sarufi sahihi, lazima pia iwe na utu ambao unaonekana kuwa halisi kwa mtu anayeongea nayo. Kazi hii kubwa ndiko kampuni hizi zinajikuta sasa.