Kufumbua DeepSeek: Kuibuka kwa Nguvu ya AI ya Uchina

DeepSeek, jina ambalo limepanda kwa kasi kutoka kuwa lisilojulikana sana hadi kuwa kitovu cha mazungumzo ya kimataifa ya AI, limezua mjadala mkali na uvumi ndani ya sekta za teknolojia na fedha. Maabara ya Kichina ya AI iliyo nyuma ya nguvu hii inayoanza imevuruga utaratibu uliowekwa, na kuwafanya wachambuzi kuhoji uendelevu wa utawala wa Marekani katika mbio za AI na uwezekano wa muda mrefu wa mahitaji ya sasa ya chipu za AI. Lakini ni sababu gani muhimu ambazo zimemsukuma DeepSeek hadi umaarufu wake wa sasa?

Asili ya DeepSeek: Kutoka kwa Hedge Fund hadi Maabara ya AI

Asili ya DeepSeek imeunganishwa kwa undani na ulimwengu wa fedha za upimaji. Inasaidiwa na High-Flyer Capital Management, mfuko wa ua wa Kichina unaojulikana kwa matumizi yake ya AI katika kufanya maamuzi ya biashara yanayoendeshwa na data.

Liang Wenfeng, shabiki wa AI mwenye uzoefu katika biashara wakati wake katika Chuo Kikuu cha Zhejiang, alianzisha High-Flyer mnamo 2015. Mnamo 2019, alizindua High-Flyer Capital Management kama mfuko wa ua kwa lengo maalum la kuendeleza na kutekeleza algorithms za AI kwa matumizi ya kifedha.

Mnamo 2023, High-Flyer iliingiza DeepSeek kama maabara ya utafiti wa AI iliyojitolea, inayofanya kazi kwa uhuru kutoka kwa biashara yake kuu ya kifedha. Baadaye, na High-Flyer kama mwekezaji mkuu, maabara hiyo ilitenganishwa na kuwa chombo tofauti, ikihifadhi jina DeepSeek.

Tangu kuanzishwa kwake, DeepSeek ilitanguliza uanzishwaji wa makundi yake ya kituo cha data ili kuwezesha mafunzo ya mfumo. Hata hivyo, sawa na kampuni nyingine za AI zinazofanya kazi nchini China, DeepSeek imekumbana na changamoto kutokana na vikwazo vya Marekani vya usafirishaji wa vifaa vya juu. Kwa hivyo, ili kufunza mifumo yake ya hivi karibuni, kampuni ilibidi itumie chips za Nvidia H800, toleo lisilo na nguvu sana la chips za H100 ambazo zinapatikana kwa urahisi kwa kampuni za Marekani.

Timu ya kiufundi ya DeepSeek inajulikana kwa ujana na uchangamfu wake. Kampuni huajiri kikamilifu watafiti wa AI wa udaktari kutoka vyuo vikuu vikuu vya Kichina. Zaidi ya hayo, DeepSeek huajiri watu kutoka asili tofauti, hata wale wasio na utaalamu wa sayansi ya kompyuta, ili kuhakikisha kwamba teknolojia yake inaweza kuelewa na kuhudumia masomo mbalimbali kwa ufanisi, kama ilivyoripotiwa na The New York Times.

Mifumo ya AI ya DeepSeek: Kupinga Hali Iliyopo

DeepSeek ilizindua seti yake ya awali ya mifumo – DeepSeek Coder, DeepSeek LLM, na DeepSeek Chat – mnamo Novemba 2023. Hata hivyo, ilikuwa ni kutolewa kwa kizazi chake kijacho cha familia ya mifumo ya DeepSeek-V2 katika majira ya kuchipua ambayo kweli ilivutia tasnia ya AI.

DeepSeek-V2, mfumo unaobadilika unaoweza kuchambua maandishi na picha, ulionyesha utendaji wa kuvutia katika vigezo mbalimbali vya AI. Hasa, ilipata utendaji huu kwa gharama ya chini sana ikilinganishwa na mifumo shindani inayopatikana wakati huo. Hii iliwashawishi wapinzani wa ndani wa DeepSeek, ikiwa ni pamoja na ByteDance na Alibaba, kupunguza bei za baadhi ya mifumo yao na kutoa zingine bure kabisa.

DeepSeek V3 imeonyesha utendaji bora ikilinganishwa na mifumo inayo pakuliwa, ya chanzo huria kama Llama ya Meta na mifumo "iliyofungwa" inayopatikana tu kupitia APIs, kama vile GPT-4o ya OpenAI.

Muhimu sawa ni mfumo wa "kutoa sababu" wa DeepSeek R1. Ilizinduliwa Januari, DeepSeek inadai kwamba R1 inafikia utendaji sawa na mfumo wa o1 wa OpenAI kwenye vigezo muhimu.

Kama mfumo wa kutoa sababu, R1 inajumuisha mifumo ya kujikagua, ikipunguza baadhi ya mitego ya kawaida inayohusishwa na mifumo ya kawaida. Ingawa mifumo ya kutoa sababu inaweza kuhitaji muda mrefu kidogo wa usindikaji ili kufikia suluhisho (kuanzia sekunde hadi dakika), huwa inaonyesha uaminifu mkubwa katika nyanja kama vile fizikia, sayansi, na hisabati.

Hata hivyo, mifumo ya DeepSeek, ikiwa ni pamoja na R1 na DeepSeek V3, iko chini ya usimamizi wa mdhibiti wa mtandao wa China, ambayo inahakikisha kwamba majibu yao yanaambatana na "maadili ya msingi ya kijamaa." Kwa mfano, katika programu ya chatbot ya DeepSeek, R1 haitajibu maswali yanayohusu Uwanja wa Tiananmen au uhuru wa Taiwan.

Mnamo Machi, trafiki ya tovuti ya DeepSeek ilizidi ziara milioni 16.5. Licha ya kupungua kwa 25% kwa trafiki ikilinganishwa na Februari, DeepSeek ilishika nafasi ya pili kwa suala la ziara za kila siku, kulingana na David Carr, mhariri wa Similarweb. Hata hivyo, takwimu hii bado ni ndogo ikilinganishwa na ChatGPT, ambayo ilizidi watumiaji hai milioni 500 wa kila wiki mnamo Machi.

Njia ya Kuvuruga Mandhari ya AI

Mfumo wa biashara wa DeepSeek unabaki kuwa wa ajabu kiasi. Kampuni inatoza bei za bidhaa na huduma zake chini ya thamani ya soko, na hata inatoa zingine bure. Zaidi ya hayo, imepinga ufadhili wa nje licha ya maslahi makubwa kutoka kwa makampuni ya mtaji wa ubia.

DeepSeek inahusisha ushindani wake mkubwa wa gharama na mafanikio katika ufanisi. Hata hivyo, baadhi ya wataalamu wamehoji usahihi wa takwimu zilizotolewa na kampuni.

Bila kujali, wasanidi programu wamekubali mifumo ya DeepSeek, ambayo, ingawa sio chanzo huria kwa maana ya jadi, inapatikana chini ya leseni zinazoruhusu zinazoruhusu matumizi ya kibiashara. Kulingana na Clem Delangue, CEO wa Hugging Face, wasanidi programu kwenye jukwaa wameunda zaidi ya mifumo 500 inayotokana na R1, wakikusanya jumla ya vipakuliwa milioni 2.5.

Mafanikio ya DeepSeek dhidi ya washindani wakubwa na walioanzishwa zaidi yameelezwa kuwa "kuvuruga AI" na "kuongezwa chumvi kupita kiasi." Mafanikio ya kampuni yalihusika kwa sehemu na kushuka kwa 18% kwa bei ya hisa ya Nvidia mnamo Januari, na kuchochea majibu ya umma kutoka kwa CEO wa OpenAI Sam Altman. Mnamo Machi, ofisi za Idara ya Biashara ya Marekani ziliripotiwa kupiga marufuku DeepSeek kwenye vifaa vya serikali, kulingana na Reuters.

Microsoft imeunganisha DeepSeek katika huduma yake ya Azure AI Foundry, jukwaa linalounganisha huduma za AI kwa makampuni. Wakati wa simu ya mapato ya robo ya kwanza ya Meta, CEO Mark Zuckerberg alisema kwamba uwekezaji katika miundombinu ya AI utaendelea kuwa "faida ya kimkakati" kwa kampuni, alipoulizwa kuhusu athari inayoweza kutokea ya DeepSeek kwenye matumizi ya AI ya Meta. Mnamo Machi, OpenAI iliiita DeepSeek kuwa "inayofadhiliwa na serikali" na "inayodhibitiwa na serikali," ikipendekeza kwamba serikali ya Marekani izingatie kupiga marufuku mifumo yake.

Wakati wa simu ya mapato ya robo ya nne ya Nvidia, CEO Jensen Huang alionyesha "ubunifu bora" wa DeepSeek, akibainisha kuwa mifumo yake ya kutoa sababu inahitaji nguvu nyingi zaidi za kompyuta, na kuwanufaisha Nvidia.

Kinyume chake, baadhi ya kampuni, nchi, na serikali, ikiwa ni pamoja na Korea Kusini na jimbo la New York, zimepiga marufuku matumizi ya DeepSeek kwenye vifaa vya serikali.

Mnamo Mei, Makamu Mwenyekiti na Rais wa Microsoft Brad Smith alishuhudia mbele ya Seneti kwamba wafanyakazi wa Microsoft wamekatazwa kutumia DeepSeek kutokana na wasiwasi kuhusu usalama wa data na propaganda zinazoweza kutokea.

Mustakabali Usio na Hakika wa DeepSeek

Muelekeo wa baadaye wa DeepSeek unabaki kuwa hauna uhakika. Ingawa maboresho zaidi ya mfumo yanatarajiwa, serikali ya Marekani inaonekana kuwa na wasiwasi zaidi kuhusu ushawishi wa kigeni unaoonekana kuwa hatari. Mnamo Machi, The Wall Street Journal iliripoti kwamba Marekani ina uwezekano wa kupiga marufuku DeepSeek kwenye vifaa vya serikali.

Kupanda kwa kasi kwa DeepSeek kumeitikisa misingi ya tasnia ya AI bila shaka, na kuchochea tathmini mpya ya mienendo ya ushindani na uwezekano wa uvumbuzi wa kuvuruga. Ikiwa inaweza kudumisha kasi yake ya sasa katika kukabiliana na uchunguzi unaoongezeka na changamoto za udhibiti bado haijulikani. Miaka ijayo itakuwa muhimu katika kuamua athari ya muda mrefu ya DeepSeek kwenye mandhari ya kimataifa ya AI. Uwezo wake wa kuendesha mwingiliano mgumu wa maendeleo ya kiteknolojia, masuala ya kijiografia, na wasiwasi wa kimaadili hatimaye utafafanua urithi wake. Ulimwengu wa AI utakuwa ukiangalia kwa karibu.

Hadithi ya DeepSeek ni ukumbusho kwamba katika ulimwengu unaobadilika kwa kasi wa akili bandia, wachezaji wapya wanaweza kuibuka haraka na kupinga utaratibu uliowekwa. Mafanikio ya kampuni, yanayoendeshwa na teknolojia ya ubunifu na utayari wa kuvuruga mifumo ya biashara ya jadi, yamelazimisha tasnia kuchukua taarifa. Wakati DeepSeek inaendelea kuendeleza na kupanua ufikiaji wake, bila shaka itachukua jukumu muhimu katika kuunda mustakabali wa AI.