Ushindani wa AI: Marekani dhidi ya DeepSeek
Katika uwanja wa hatari kubwa wa akili bandia, hadithi ya Daudi dhidi ya Goliathi inajitokeza. Marekani, ikiwa na mradi wake kabambe wa “Stargate” na uwekezaji wa dola bilioni 500, inalenga kuimarisha nafasi yake kama kiongozi wa kimataifa wa AI. Juhudi hizi kubwa, zinazoungwa mkono na makampuni makubwa ya teknolojia, zinalenga kuanzisha mtandao wa vituo vya data vya kisasa kote nchini. Hata hivyo, kampuni changa ya Kichina, inayofanya kazi kwa kile ambacho wengine wanaweza kuita “bajeti ya mzaha,” imeibuka kama mpinzani mkuu, ikitupa kivuli juu ya matarajio ya Marekani.
DeepSeek, kampuni iliyoanzishwa Hangzhou, hivi karibuni imezindua mfululizo wa mifumo ya AI ya chanzo huria ambayo sio tu inalingana lakini, katika baadhi ya matukio, inazidi utendaji wa mifumo ya OpenAI. Zaidi ya hayo, wamefanikiwa hili kwa ufanisi wa ajabu na kwa sehemu ndogo ya gharama. Maendeleo haya yametuma mawimbi katika jumuiya ya AI, na kuibua maswali kuhusu ufanisi wa mkakati wa Marekani na mustakabali wa ubora wa AI.
Mabadiliko katika Mandhari ya AI
Mandhari ya AI kwa sasa inatawaliwa na wachezaji wachache wakuu, hasa wakiwa Marekani. Makampuni haya, yakiwa na fedha na rasilimali nyingi, yamekuwa mstari wa mbele katika uvumbuzi wa AI, yakitengeneza mifumo yenye nguvu ambayo inasaidia matumizi mbalimbali. Hata hivyo, kuibuka kwa DeepSeek kunaashiria mabadiliko yanayoweza kutokea katika mienendo hii, kuonyesha kwamba AI ya msingi inaweza kutengenezwa kwa rasilimali chache sana.
Mfumo wa R1 wa DeepSeek, uliotolewa mapema wiki hii, ni mfano mkuu wa usumbufu huu. Kulingana na kampuni, mfumo huu unalingana na hata kuzidi utendaji wa mfumo wa o1 wa OpenAI, ambao ulitolewa mwaka jana na uliundwa kushughulikia hoja ngumu na matatizo ya hisabati. Ukweli kwamba mfumo wa DeepSeek ni wa chanzo huria na unapatikana kwa urahisi kwa umma huongeza zaidi athari zake, kuruhusu watafiti na watengenezaji duniani kote kutumia uwezo wake. Wakaguzi wamesifu uwezo wa mfumo wa R1 kushughulikia kazi kama vile kuandika misimbo na hoja, na kuiweka katika ushindani wa moja kwa moja na mifumo ya hali ya juu zaidi sokoni.
Ufanisi wa Gharama wa DeepSeek
Mafanikio haya ni ya ajabu zaidi ukizingatia rasilimali ambazo DeepSeek inazo. Mfumo mkuu wa lugha wa V3 wa kampuni, uliotangazwa mwezi Desemba, uliripotiwa kufunzwa kwa kutumia thamani ya dola milioni 5.6 tu ya nguvu ya kompyuta. Hii ni tofauti kubwa na zaidi ya dola milioni 100 ambazo ziliripotiwa kutumika kufunza GPT-4 ya OpenAI. Mfumo wa V3 wa DeepSeek umelinganishwa na mifumo kutoka OpenAI na Anthropic, huku DeepSeek ikidai usawa katika utendaji. Andrej Karpathy, mtafiti mashuhuri wa AI ambaye hapo awali alifanya kazi katika Tesla na OpenAI, ameelezea uwezo wa DeepSeek kufunza AI yake ya hali ya juu kwa “bajeti ya mzaha” kama ya kuvutia sana.
Umuhimu wa DeepSeek nchini China
Kupanda kwa DeepSeek hadi umaarufu katika sekta ya ushindani ya AI ya China sio kwa bahati mbaya. Mwanzilishi wa kampuni huyo mwenye umri wa miaka 40, Liang Wenfeng, hivi karibuni alikutana na Waziri Mkuu wa China Li Qiang, akisisitiza umuhimu wa mafanikio ya DeepSeek ndani ya taifa. Mkutano huu, ulihudhuriwa na wataalamu wengine wakuu wa sekta hiyo, unaangazia dhamira ya China ya kukuza uvumbuzi wa kiteknolojia na matarajio yake katika uwanja wa AI. Mafanikio ya DeepSeek yanatumika kama ushahidi wa ustadi na uwezo wa sekta ya teknolojia ya China, kuonyesha uwezo wake wa kushindana katika jukwaa la kimataifa licha ya kukabiliwa na vikwazo vya kupata teknolojia fulani.
Asili ya DeepSeek
Asili ya DeepSeek inarudi nyuma hadi HighFlyer, mfuko wa ua wa kiasi wa Kichina ambao ulisimamia takriban dola bilioni 1.4 katika mali kufikia 2019. HighFlyer ilizindua DeepSeek mnamo 2023, na kuiweka kama kampuni changa ya AI iliyojitolea kuzingatia utengenezaji wa mifumo na uundaji wa bidhaa za AI. Liang Wenfeng, ambaye ana historia katika AI kutoka Chuo Kikuu cha Zhejiang, alishirikiana kuanzisha HighFlyer na kutumia rasilimali zake za kifedha kupata maelfu ya chips za Nvidia AI kabla ya kuwekwa kwa vikwazo vya Marekani mnamo 2022. Hatua hii ya kimkakati ilipa DeepSeek faida kubwa juu ya kampuni zingine changa za AI, ikiruhusu kuendelea na utafiti na maendeleo yake wakati wengine walikuwa wakihangaika kupata nguvu ya usindikaji.
Utendaji na Ubunifu wa DeepSeek
Wakati wataalamu wana maoni tofauti kuhusu utendaji wa DeepSeek kuhusiana na ChatGPT ya OpenAI na Claude ya Anthropic, makubaliano ya jumla ni kwamba mifumo ya DeepSeek inafanya vizuri sana chini ya usanidi maalum wa maunzi. Hata hivyo, wanaweza kukumbana na changamoto katika matukio mengine. Lengo la DeepSeek ni kuboresha ufanisi na kupunguza gharama, ambayo inaonekana katika mfumo wake wa ubunifu wa “mchanganyiko wa wataalamu”. Mfumo huu hutumia sehemu tofauti za AI kushughulikia maswali maalum, kuboresha utendaji na matumizi ya rasilimali.
Kipengele kingine muhimu cha kutofautisha mifumo ya DeepSeek ni asili yake ya chanzo huria, kuruhusu matumizi kwenye majukwaa mbalimbali ya maunzi. Muhimu zaidi, mifumo ya DeepSeek hutoa uwazi, ikifunua jinsi wanavyofikia majibu yao, tofauti na o1 ya OpenAI. Uwazi huu ni sehemu muhimu ya kuuza kwa wateja ambao wanatafuta suluhisho za AI za gharama nafuu, hasa wale ambao wametengwa kutoka soko la mifumo ya gharama kubwa iliyotengenezwa na Marekani na wale ambao wamezuiwa kupata nguvu ya kompyuta ya Marekani.
Vikwazo vya Marekani na Mikakati Mbadala ya China
Wasiwasi wa Marekani kuhusu maendeleo ya China katika AI hauna msingi. Serikali ya Marekani imekuwa ikijaribu kikamilifu kuzuia maendeleo ya AI ya China kupitia udhibiti wa mauzo ya nje wa chips za hali ya juu za AI tangu 2022. Hii imewazuia kwa ufanisi makampuni ya Kichina kupata wasindikaji muhimu kufunza mifumo ya AI ya hali ya juu. Licha ya vikwazo hivi, watengenezaji wa chips kama Nvidia na Intel wamejaribu kuunda wasindikaji wanaokidhi mahitaji ya Marekani kwa soko la China, lakini wanakabiliwa na kuimarishwa zaidi kwa sheria na Washington.
Vikwazo hivi vimelazimisha makampuni ya AI ya Kichina kuchunguza mikakati mbadala. Baadhi wanategemea chips zilizotengenezwa na Marekani ambazo ziliingizwa kabla ya marufuku, huku wengine wakigeukia pete za magendo za soko la kijivu ambazo husafirisha chips kutoka maeneo ya wahusika wengine. Baadhi wanachunguza vituo vya data nje ya China, huku wengine wakitegemea njia mbadala zilizotengenezwa na China kutoka kwa makampuni kama Huawei. Wakati Huawei inadai kwamba chips zake za AI zinazidi wasindikaji wa A100 wa Nvidia, imekumbana na changamoto katika kuzizalisha kwa uhakika kwa kiwango kikubwa.
Liang Wenfeng amesema kwamba “pesa haijawahi kuwa tatizo kwetu; marufuku ya usafirishaji wa chips za hali ya juu ndio tatizo.” Kauli hii inasisitiza vikwazo muhimu ambavyo makampuni ya Kichina yanakabiliana navyo katika harakati zao za uongozi wa AI. Mbali na marufuku ya mauzo ya nje ya chips, utawala wa Biden pia umepiga marufuku uwekezaji wa Marekani katika AI ya Kichina, na kuzidisha hali hiyo.
Mfumo wa AI wa China
Licha ya changamoto hizi, China imekuza mfumo wa AI unaostawi. Makampuni makubwa ya teknolojia kama vile Baidu, Alibaba, na ByteDance yanatengeneza mifumo yao ya msingi na kutoa huduma zinazotegemea AI. Kampuni changa za AI za Kichina kama vile MiniMax na Moonshot AI zimezindua huduma zinazolenga watumiaji ambazo zimepata mafanikio hata katika soko la Marekani.
Ushindani mkali ndani ya sekta ya AI ya Kichina umesababisha vita vya bei, huku makampuni yakipunguza bei kwa kiasi kikubwa hadi 90% katika 2024 ili kupata ushindani. Vita hivi vya bei vinaangazia zaidi uwezo na kubadilika kwa sekta ya AI ya Kichina.
Wasiwasi wa Marekani na Majibu
Marekani inazidi kuwa na wasiwasi kuhusu mafanikio ya China katika AI, kwani inaashiria kwamba hatua zilizochukuliwa kulinda uongozi wa Marekani katika AI hazifanyi kazi. Mkurugenzi Mkuu wa zamani wa Google Eric Schmidt ameonyesha mshangao wake kuhusu maendeleo ya China, akisema kwamba “nilidhani vikwazo tulivyoweka kwenye chips vingewazuia.”
OpenAI, mtengenezaji wa ChatGPT, pia ameibua wasiwasi kuhusu maendeleo ya AI ya China. Katika karatasi ya sera ya hivi karibuni, OpenAI ilisema kwamba kuna takriban dola bilioni 175 katika fedha za kimataifa zinazosubiri uwekezaji katika miradi ya AI. Kampuni hiyo ilionya kwamba “ikiwa Marekani haitavutia fedha hizo, zitaelekea kwenye miradi inayoungwa mkono na China—kuimarisha ushawishi wa kimataifa wa Chama cha Kikomunisti cha China.”
Kujibu wasiwasi huu, Mkurugenzi Mkuu wa OpenAI Sam Altman, Mkurugenzi Mkuu wa SoftBank Masayoshi Son, na mwanzilishi mwenza wa Oracle Larry Ellison wametangaza Mradi wa Stargate, ambao unaahidi kuwekeza dola bilioni 500 katika miundombinu ya AI kote Marekani. Mradi huu ni ishara wazi ya dhamira ya Marekani ya kudumisha uongozi wake katika uwanja wa AI.
Njia ya Uongozi wa AI
Hata hivyo, kuibuka kwa makampuni kama DeepSeek kunaonyesha kwamba njia ya uongozi wa AI inaweza kuwa si rahisi kama kuwekeza kiasi kikubwa cha pesa. Uwezo wa kubuni, kubadilika, na kufikia mafanikio kwa rasilimali chache ni jambo muhimu katika mandhari ya sasa ya AI. Kadiri mbio za AI zinavyoendelea kuongezeka, ulimwengu utakuwa ukiangalia kwa karibu jinsi Marekani na China zinavyoendesha changamoto hizi ngumu. Matokeo yatakuwa na athari kubwa kwa mustakabali wa teknolojia na mienendo ya nguvu ya kimataifa. Hadithi ya DeepSeek inatumika kama ukumbusho kwamba ustadi na uwezo wa rasilimali unaweza kuwa nguvu kubwa katika mbio za ubora wa AI. Wakati Marekani inawekeza sana ili kudumisha uongozi wake, changamoto kutoka China, hasa kutoka kwa kampuni changa za ubunifu kama DeepSeek, ni kubwa. Miaka ijayo itakuwa muhimu katika kuamua mshindi wa mwisho katika shindano hili la hatari kubwa. Mandhari ya AI inabadilika kwa kasi, na mienendo kati ya nguvu hizi mbili za kimataifa itaendelea kuunda mustakabali wa teknolojia hii ya mabadiliko.