Shanghai Goku Technologies, mfuko wa uwekezaji wa kimataifa kutoka Shanghai, unazua gumzo kubwa katika jumuiya ya akili bandia (AI) kwa kuwasilisha mbinu mpya ya mafunzo ambayo inaweza kuleta mapinduzi makubwa. Mbinu hii bunifu, iliyoandikwa kwa kina katika karatasi ya utafiti iliyowasilishwa kwa Kongamano la Kimataifa la Mifumo ya Usindikaji wa Habari za Neural (NeurIPS), ina uwezo wa kushindana, au hata kuzidi, ufanisi wa mbinu za mafunzo za AI zilizopo ambazo zinatumiwa na mashirika maarufu ya utafiti kama vile DeepSeek na OpenAI. Hatua hii inaakisi mwelekeo wa DeepSeek yenyewe, ambayo ilipata umuhimu mkubwa kwa maendeleo yake katika algoriti za AI.
Kufungua SASR ya Goku
Shanghai Goku Technologies, iliyoanzishwa mwaka 2015, imeanzisha mfumo mpya wa mafunzo ya AI uliopewa jina la SASR, au mafunzo mseto ya hatua kwa hatua. Mbinu hii inalenga kushughulikia mapungufu yanayoonekana ya mbinu zinazotumiwa sana kama vile usimamizi wa kurekebisha (SFT) na kujifunza kwa kuimarisha (RL). Goku anadai kwamba SASR, iliyoongozwa na jinsi wanadamu wanavyoendeleza ujuzi wa kufikiri, inatoa njia bora zaidi na yenye ufanisi wa kujenga mifumo ya hali ya juu ya AI.
SFT na RL zinachukuliwa kuwa nguzo kuu katika mchakato wa mafunzo ya AI, zinazoajiriwa na makampuni makubwa kama vile OpenAI na DeepSeek. DeepSeek imesisitiza wazi jukumu muhimu la mbinu hizi katika kuboresha utendaji wa mfumo wake wa V3, ambao ulitolewa mnamo Desemba na ukaamsha shauku kubwa ndani ya sekta ya teknolojia.
Kulingana na karatasi ya utafiti ya Goku, iliyoandikwa kwa ushirikiano na watafiti kutoka Chuo Kikuu cha Shanghai Jiao Tong na shirika lake jipya la AI, Shanghai AllMind Artificial Intelligence Technology, SASR inaonyesha utendaji bora zaidi ikilinganishwa na SFT, RL, na mbinu tuli za mafunzo mseto. “Matokeo ya majaribio yanaonyesha kuwa SASR inazidi mbinu za SFT, RL na mbinu tuli za mafunzo mseto,” timu ya Goku ilisisitiza katika karatasi yao ya utafiti.
Athari za Maendeleo ya Goku
Mafanikio ya mafunzo ya AI ya Goku yanaripotiwa kuashiria maendeleo endelevu ya Uchina katika uwanja wa AI. Inaweza kuangazia mapungufu ya sera za sasa zinazotekelezwa na serikali ya Marekani, zinazolenga kuzuia maendeleo ya AI ya Uchina kupitia vizuizi vya vifaa. Jensen Huang, Mkurugenzi Mtendaji wa Nvidia, hivi karibuni ametoa maoni juu ya kutofaa kwa vizuizi hivi, akisema kwamba “Uchina ina asilimia 50 ya watengenezaji wa AI duniani.”
DeepSeek, kampuni mpya ya AI ya Kichina ambayo ilitoka katika mfuko wa ua wa High-Flyer, imepata umaarufu mkubwa kwa kuonyesha uwezo wa Uchina wa uongozi wa AI kupitia hesabu za hali ya juu na ujumuishaji wa vifaa na programu.
Jukumu la AllMind katika Mkakati wa AI wa Goku
Kuanzishwa kwa AllMind, sambamba na uchapishaji wa utafiti wa Goku, kunaashiria hatua ya kimkakati ya kujitolea rasilimali kwa utafiti na maendeleo ya AI. Kumbukumbu za usajili wa biashara za Kichina zinaonyesha kuwa AllMind ilisajiliwa rasmi siku ile ile ambayo Goku alitoa utafiti wake.
Wang Xiao, mwanzilishi wa Goku na mwakilishi wa kisheria wa AllMind, amesema kuwa shirika jipya liliundwa kuchunguza mipaka mipya ya AI. Hii inaakisi mbinu iliyochukuliwa na High-Flyer, ambayo ilianzisha DeepSeek kama shirika tofauti mnamo 2023.
Hadi mwisho wa mwaka jana, Goku alisimamia zaidi ya yuan bilioni 15 (takriban dola za Kimarekani bilioni 2.1) katika mali za ndani na kimataifa, akitumia mikakati inayoendeshwa na AI, kulingana na habari inayopatikana kwenye tovuti yake rasmi.
Kuchunguza SASR kwa kina: mfumo wa mafunzo mseto ya hatua kwa hatua
Mfumo wa SASR wa Goku unatoa mbadala ya kuvutia katika mazingira ya mafunzo ya mfumo wa AI. Ili kufahamu kikamilifu uwezekano wake wa athari, uelewa wa kina zaidi wa vipengele vyake na utendaji wake ni muhimu.
Kipengele cha “hatua kwa hatua” cha SASR kinamaanisha mchakato wa mafunzo wa hatua nyingi ambapo mfumo wa AI hufanyiwa uboreshaji wa mara kwa mara. Kila hatua inawezekana kuhusisha malengo maalum na kutumia data tofauti ya mafunzo ili kukuza uwezo maalum ndani ya mfumo. Mbinu hii ya awamu inaweza kutoa faida kama vile kupunguza changamoto za kufunza mifumo changamano kutoka mwanzo na kuruhusu uboreshaji maalum katika kila hatua.
Kipengele cha “adaptive” kinaashiria kuwa mchakato wa mafunzo si tuli bali unajibu kikamilifu utendaji na sifa za mfumo. Uendeshaji huu unaweza kuhusisha kurekebisha vigezo, kurekebisha usambazaji wa data ya mafunzo, au kupima kwa nguvu mchango wa malengo tofauti ya mafunzo. Mchakato wa adaptive huwezesha AI kujifunza na kuboresha kwa ufanisi zaidi.
Hali ya “mseto” ya SASR inaonyesha kuwa inachanganya vipengele vya mbinu tofauti za mafunzo. Hili ni jambo muhimu kwa sababu kuna nguvu na udhaifu katika SFT na RL. Mchanganyiko wa mbinu huwezesha mfumo kutumia faida za kila mbinu huku ukishughulikia mapungufu yake. Kwa kuunganisha sifa hizi tatu, SARS kimsingi imeboreshwa zaidi ili kuendeleza mantiki na uwezo wa mawazo.
Kulinganisha SASR na Mbinu za Jadi
Usimamizi wa kurekebisha (SFT) kimsingi hutegemea hifadhidata kubwa, iliyoandikwa ambapo mfumo wa AI hujifunza kuleta inputs hadi outputs zinazohitajika. Kujifunza kwa kuimarisha (RL) kunahusisha kufunza mfumo kupitia jaribio na makosa, kuthawabisha au kuadhibu vitendo ili kuongeza lengo maalum.
SASR inajaribu kuunganisha hizo mbili huku ikishinda mapungufu ya kila mbinu. Kwa mfano, SFT inaweza kutegemea sana ubora na ukamilifu wa data iliyoandikwa. Katika matukio mengi ya ulimwengu halisi, kupata data ya kutosha na sahihi inaweza kuwa ya muda mrefu na ya gharama kubwa. RL, ingawa hauhitaji data iliyoandikwa, inaweza kuwa isiyo imara na kuathiriwa na utapeli wa zawadi. Utapeli wa zawadi hutokea wakati mfumo wa AI unagundua njia zisizokusudiwa za kuongeza zawadi yake, ambayo inaweza kusababisha tabia isiyofaa.
Mfumo wa Goku una uwezekano wa kuwa uboreshaji juu ya mapungufu ya SFT na RL. Hata hivyo, upimaji zaidi na unaoendelea unahitajika ili kuthibitisha matokeo ya awali yaliyoandikwa katika karatasi ya kampuni.
Ubunifu wa Algorithmic na Vizuizi vya Vifaa
Habari za mfumo wa SASR wa Goku ni muhimu sana katika muktadha wa mahusiano ya teknolojia ya Marekani na China. Kwa muda, serikali ya Marekani imejaribu kupunguza kuongezeka kwa Uchina katika uwanja wa AI kwa kuzuia upatikanaji wa vifaa vya kompyuta vya hali ya juu, hasa GPUs za hali ya juu kutoka kwa makampuni kama Nvidia. Dhana iliyo nyuma ya vizuizi hivi ni kwamba kupunguza upatikanaji wa Uchina wa vifaa vyenye nguvu kutapunguza juhudi zao za maendeleo ya AI.
Hata hivyo, maoni ya Mkurugenzi Mtendaji wa Nvidia Jensen Huang na maendeleo yanayojitokeza kutoka kwa maabara za AI za Kichina yanaonekana kupendekeza kwamba sera hizi zinaweza zisiwe na ufanisi kama ilivyokusudiwa. Huang amebainisha kwa umaarufu kwamba Uchina inamiliki sehemu kubwa ya talanta ya watengenezaji wa AI duniani, na kwamba kuzuia upatikanaji wa vifaa kunaweza kuwahamasisha kupata suluhisho mbadala.
Madai ya mafanikio ya AI ya Goku yanaonyesha kwamba uvumbuzi wa algorithmic unaweza uwezekano wa kukabiliana na mapungufu ya vifaa, angalau kwa kiasi fulani. Ikiwa watafiti wa Kichina wanaweza kuendeleza algorithms bora zaidi za mafunzo, wanaweza kuwa na uwezo wa kufikia utendaji sawa wa AI na vifaa visivyo na nguvu. Hii inaweza kuwa na athari kubwa kwa mandhari ya AI ya kimataifa, kwani inaonyesha kwamba Uchina inaweza kuendelea kuendeleza uwezo wake wa AI licha ya vizuizi vinavyoendelea.
Hii haipaswi kupendekeza kwamba vifaa havihusiani. GPUs za hali ya juu bado ni muhimu kwa kufunza mifumo ya kisasa ya AI, na upatikanaji wa vifaa vya hivi karibuni bila shaka hutoa faida kubwa ya ushindani. Hata hivyo, kazi ya Goku inaonyesha umuhimu wa kuwekeza katika vifaa na programu, na kwamba maendeleo katika eneo moja yanaweza kukabiliana na mapungufu katika nyingine.
Kupanda kwa AI ya Kichina: Zaidi ya DeepSeek
K ظهور DeepSeek كلاعب بارز في مجال الذكاء الاصطناعي كان قوة دافعة, تُظهر تصميم الصين على أن تصبح رائدة عالمية في هذه التقنية التحويلية. ومع ذلك, فإن DeepSeek هي مجرد مثال واحد, وصعود Goku, مع إطار عمل التدريب SASR الخاص بها, يوضح بشكل أكبر القوة المتزايدة والابتكار داخل النظام البيئي للذكاء الاصطناعي الصيني.
Vipengele kadhaa vinachangia kasi hii. Kwanza, Uchina ina hifadhi kubwa ya data, ambayo ni muhimu kwa kufunza mifumo ya AI. Ikiwa na idadi kubwa ya watu na matumizi makubwa ya teknolojia za kidijitali, makampuni ya Kichina yana upatikanaji wa hifadhidata kubwa ambazo zinaweza kutumika kuendeleza na kuboresha algorithms zao za AI.
Pili, Uchina ina msisitizo mkubwa juu ya elimu ya STEM, ikizalisha idadi kubwa ya wahandisi na wanasayansi wenye vipaji. Hii imeunda nguvu kazi yenye ujuzi wa hali ya juu inayoweza kuendesha uvumbuzi katika AI na nyanja zinazohusiana.
Tatu, serikali ya Kichina imefanya AI kuwa kipaumbele cha kimkakati, ikitoa ufadhili na msaada mkubwa kwa utafiti na maendeleo. Hii imeunda mazingira bora kwa makampuni mapya ya AI na kukuza ushirikiano kati ya academia na tasnia.
Hatimaye, makampuni ya Kichina mara nyingi yako tayari kuchukua mbinu ya vitendo zaidi na yenye hatari kwa uvumbuzi, ambayo huwaruhusu kuhamisha haraka na kujaribu mawazo mapya.
Kama matokeo ya mambo haya, Uchina inakaribia haraka Marekani katika suala la uwezo wa AI. Wakati Marekani bado inaongoza katika maeneo fulani, kama vile utafiti wa msingi na vifaa vya hali ya juu, Uchina inafanya maendeleo makubwa katika maeneo kama vile maono ya kompyuta, usindikaji wa lugha asilia, na roboti.
Kujitokeza kwa makampuni kama vile Goku na DeepSeek kunaonyesha kwamba Uchina iko katika nafasi nzuri ya kuendelea kupanda kwake katika uwanja wa AI katika miaka ijayo.
Teknolojia za Shanghai Goku: Kampuni Nyuma ya Ubunifu
Shanghai Goku Technologies ni mfuko wa biashara ya kiasi iliyoanzishwa mwaka 2015. Inasimamia mali kubwa kwa kutumia mikakati inayoendeshwa na AI. Madhumuni yaliyoelezwa ya kampuni ni “kuunganisha teknolojia na uchambuzi wa kimsingi” ili kutoa faida bora kwa wateja wake. Kando na biashara yake kuu katika usimamizi wa mali, Goku ameonyesha kujitolea kwa kusukuma mipaka ya utafiti wa AI. AllMind Artificial Intelligence Technology, kampuni tanzu ya AI, inawakilisha hatua ya kimkakati ya kurasimisha na kuongeza kasi ya juhudi zake za utafiti wa AI.
Maelezo kuhusu muundo wa ndani wa kampuni na mienendo ya uendeshaji inabaki kuwa chache. Hata hivyo, taarifa zake za umma na shughuli za hivi karibuni hutoa maarifa katika mbinu yake. Maneno ya kampuni, ambayo yanatafsiriwa kuwa “mantiki na ukweli ndio kanuni pekee tunazozitii”, yanaonyesha utamaduni unaoendeshwa na data na uchambuzi. Uwekezaji katika utafiti na maendeleo ya AI unaonyesha maono ya muda mrefu na ufahamu wa uwezo wa mabadiliko wa AI, sio tu ndani ya sekta ya fedha bali pia katika tasnia mbalimbali. Inawezekana kwamba Goku ananuia kutumia ufahamu kutoka kwa utafiti wa AI ili kuboresha mikakati yao ya biashara na kupata faida ya ushindani katika soko.