Zaidi ya Usajili: Kufichua Njia Mbadala za AI Huria

Mandhari ya akili bandia, ambayo hapo awali yalionekana kutawaliwa na makampuni machache makubwa ya Silicon Valley kama OpenAI, Google, Meta, na Microsoft, yanapitia mabadiliko ya kuvutia. Wakati wachezaji hawa walioimarika wakiendelea na mbio zao za maendeleo zenye ushindani mkubwa, mara nyingi wakiweka uwezo wao wa hali ya juu nyuma ya malipo ya usajili, mkondo wenye nguvu unaopingana nao unapata kasi. Wimbi jipya la washindani, hasa kutoka vituo vya uvumbuzi nchini China, linaonyesha kuwa akili bandia ya kisasa si lazima ihitaji gharama kubwa au usiri wa umiliki. Makampuni kama DeepSeek, Alibaba, na Baidu yanaingia kwenye jukwaa la kimataifa, yakitetea modeli zenye nguvu ambazo mara nyingi hutolewa kama chanzo huria au mbadala za gharama nafuu, zikipinga kimsingi mifumo ya biashara iliyopo na kupanua uwezekano kwa watengenezaji na watumiaji duniani kote.

Mienendo hii inayoibuka inawakilisha zaidi ya washindani wapya tu wanaoingia kwenye ushindani; inaashiria mabadiliko yanayoweza kutokea katika falsafa inayounga mkono maendeleo na upatikanaji wa AI. Uamuzi wa wachezaji hawa wapya kutoa modeli za kisasa chini ya leseni ruhusu, kufanya msimbo wa msingi upatikane kwa urahisi kwenye majukwaa kama GitHub na Hugging Face, unasimama kinyume kabisa na mbinu isiyo wazi, ya bustani iliyofungwa inayopendelewa na baadhi ya makampuni makubwa ya Magharibi. Uwazi huu sio tu unademokrasisha upatikanaji wa zana zenye nguvu lakini pia unakuza mfumo-ikolojia mzuri ambapo watengenezaji wanaweza kujaribu kwa uhuru, kubinafsisha, na kujenga juu ya modeli hizi za msingi, uwezekano wa kuharakisha uvumbuzi kwa kasi isiyo na kifani. Hebu tuchunguze mifano mitatu maarufu inayoongoza harakati hii, tukichunguza asili yao, uwezo wao, na athari za mikakati yao ya wazi.

DeepSeek: Mgeni Mjanja Anayetikisa Mfumo Uliopo

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., inayofanya kazi chini ya jina fupi la DeepSeek, iliingia kwenye uwanja wa kimataifa wa AI kwa kasi na athari ya ajabu. Ingawa ni taasisi changa kiasi, iliyoanzishwa rasmi Aprili 2023 kama tawi la kampuni ya biashara ya kiasi High-Flyer Quant, DeepSeek ilipata umakini haraka kwa kutengeneza modeli za AI zilizoshindana, na katika baadhi ya vigezo ziliripotiwa kuzidi, zile za makampuni makubwa ya sekta hiyo yenye mizunguko mirefu zaidi ya maendeleo na bajeti kubwa zaidi. Uwezo huu wa kufikia utendaji wa ushindani kwa ufanisi unaoonekana kuwa mkubwa ulileta mshtuko katika sekta hiyo.

Mzunguko wa haraka wa urudufishaji wa kampuni hiyo ni wa kuzingatiwa. Kuanzia na DeepSeek-LLM yake ya awali, ilifuatiwa haraka na modeli maalum kama DeepSeek-Math. Tangazo la DeepSeek V2 na baadaye DeepSeek V3 mwishoni mwa 2024 tayari liliashiria mwelekeo kabambe wa kampuni. Hata hivyo, ilikuwa ni uzinduzi wa modeli zake za hoja, DeepSeek-R1 na DeepSeek-R1-Zero, mnamo Januari 2025 ambao ulikamata kweli mawazo ya sekta hiyo na bila shaka uliashiria mabadiliko. Modeli hizi zililinganishwa moja kwa moja na mara nyingi kwa upendeleo na mfululizo wa hali ya juu wa GPT-4 wa OpenAI na modeli yake iliyotarajiwa ya ‘o1’, na kusababisha mjadala mkubwa kuhusu hali ya sanaa katika hoja za AI. Utangulizi haukuwa wa kitaaluma tu; iliripotiwa kuathiri bei za hisa za washindani, kusababisha tathmini upya za kimkakati ndani ya maabara za AI zilizoimarika, na hata kuibua mijadala miongoni mwa vyombo vya serikali kuhusu athari za AI yenye nguvu na inayopatikana kwa urahisi inayotoka kwa wachezaji wapya wa kimataifa.

DeepSeek inatumia kile inachokiita mkakati wa ‘open weight’ kwa modeli zake nyingi, ikizitoa chini ya leseni ruhusu ya MIT License. Ingawa hii inaweza isilingane na chanzo huria 100% kwa ufafanuzi mkali zaidi (kwani vipengele fulani vya data ya mafunzo au mbinu vinaweza kubaki kuwa vya umiliki), inawakilisha kiwango kikubwa cha uwazi. Muhimu zaidi, uzito wa modeli - vigezo vinavyojumuisha maarifa yaliyojifunza ya modeli - hufanywa kupatikana. Hii inaruhusu watengenezaji kupakua modeli kutoka kwenye hazina kama GitHub na Hugging Face, kuwawezesha kuendesha modeli ndani ya nchi, kuziboresha kwa kazi maalum, kuzijumuisha katika programu za kipekee, au kusoma tu usanifu wao. Kiwango hiki cha ufikiaji ni tofauti kabisa na kuingiliana tu kupitia API iliyozuiliwa au kiolesura cha wavuti kilichofungwa.

Kwa mtazamo wa mtumiaji, DeepSeek kimsingi inajidhihirisha kama zana ya AI ya mtindo wa chatbot, inayopatikana kupitia kiolesura cha wavuti na programu za simu za mkononi zilizojitolea kwa majukwaa ya iOS na Android. Ushawishi wake unaokua unathibitishwa zaidi na orodha inayokua ya ushirikiano. Teknolojia ya DeepSeek inajumuishwa au kuchunguzwa na wachezaji wakuu wa teknolojia, ikiripotiwa kujumuisha Lenovo, Tencent, Alibaba, na Baidu, ikionyesha uwezekano wake wa matumizi katika mifumo mbalimbali ya vifaa na programu. Kuongezeka kwa DeepSeek kunasisitiza mada kuu: mafanikio makubwa ya AI si tena uwanja wa kipekee wa maabara za utafiti zilizoimarika kwa muda mrefu, na maendeleo yenye ufanisi pamoja na uwazi wa kimkakati yanaweza kubadilisha haraka mazingira ya ushindani.

Qwen ya Alibaba: Uwazi kwa Kiwango Kikubwa kutoka kwa Jitu la Biashara Mtandaoni

Wakati DeepSeek inawakilisha kampuni changa inayopinga hali iliyopo, Alibaba Qwen (Tongyi Qianwen) inaashiria kukumbatia kimkakati kwa uwazi na moja ya makampuni makubwa zaidi ya teknolojia nchini China, na kwa hakika duniani. Alibaba, inayojulikana kwa himaya yake kubwa ya biashara mtandaoni, huduma za kompyuta ya wingu, na miradi mbalimbali ya kiteknolojia, iliingia kwenye mbio za AI za uzalishaji ikiwa na rasilimali kubwa na tamaa. Familia ya Qwen ya modeli kubwa za lugha ilijiimarisha haraka miongoni mwa matoleo yanayoongoza ya chanzo huria duniani kote.

Safari ilianza na toleo la beta mnamo Aprili 2023, ikipata mvuto haraka ndani ya jumuiya ya AI huku Alibaba ikiendelea kutoa modeli mbalimbali chini ya leseni za chanzo huria mwaka huo wote. Ahadi hii ya uwazi imeendelea kwa kiasi kikubwa na marudio yaliyofuata. Ingawa baadhi ya matoleo maalum sana au yenye hisia za kibiashara yanaweza kuwa na leseni tofauti, modeli za msingi ndani ya mfululizo wa Qwen, ikiwa ni pamoja na Qwen 2, mfululizo wa Qwen-VL wa aina nyingi (unaoshughulikia maandishi na picha), Qwen-Audio, na Qwen2-Math inayoelekea kwenye hisabati, mara nyingi zimefanywa kupatikana chini ya leseni ruhusu kama Apache 2.0 License. Hii inaruhusu matumizi mapana ya kibiashara na utafiti, na hivyo kuchochea zaidi upokeaji. Kama DeepSeek, modeli hizi zinapatikana kwa urahisi kwa jumuiya ya watengenezaji wa kimataifa kupitia majukwaa kama GitHub na Hugging Face.

Alibaba haijasita kulinganisha modeli zake moja kwa moja na bora zaidi za sekta hiyo. Tangazo la Qwen 2.5-Max mnamo Januari 2025 na Qwen2.5-VL ya aina nyingi mnamo Machi 2025 lilikuja na madai ya kijasiri, yakizitangaza kuwa na uwezo unaozidi au kushindana na modeli maarufu kama GPT-4o ya OpenAI, V3 ya DeepSeek, na Llama-3.1-405B yenye nguvu ya Meta. Ingawa matokeo ya vigezo yanaweza kuwa chini ya tafsiri na tathmini maalum za kazi, maendeleo thabiti na msimamo wa ushindani unasisitiza nia kubwa ya Alibaba katika uwanja wa AI.

Kwa kuvutia, modeli ya awali ya Qwen ilikiri urithi wake, ikiwa kwa sehemu inategemea Llama LLM ya msingi ya Meta - yenyewe ikiwa ni toleo la kihistoria la chanzo huria ambalo lilichochea shughuli nyingi katika uwanja huo. Hata hivyo, Alibaba imebadilisha kwa kiasi kikubwa na kujenga juu ya msingi huu, ikitengeneza usanifu wake wa kipekee na mbinu za mafunzo kwa vizazi vilivyofuata vya Qwen. Mageuzi haya yanaangazia muundo wa kawaida katika ulimwengu wa chanzo huria: kujenga juu ya kazi iliyopo ili kuunda uwezo mpya na ulioboreshwa.

Athari za mkakati wa wazi wa Qwen labda zinaonyeshwa vyema zaidi na takwimu ya kushangaza iliyotajwa: zaidi ya modeli 90,000 huru zimeripotiwa kutengenezwa kulingana na msimbo wa chanzo huria wa Qwen. Takwimu hii inasema mengi kuhusu nguvu ya usambazaji wazi. Inaashiria mfumo-ikolojia unaostawi ambapo watafiti, kampuni changa, na watengenezaji binafsi wanatumia kazi ya msingi ya Alibaba kuunda zana maalum, kufanya majaribio mapya, na kusukuma mipaka ya AI katika pande mbalimbali. Kwa watumiaji wa mwisho, Qwen kwa kawaida hufikiwa kupitia kiolesura cha chatbot kinachojulikana, kinachopatikana kwenye wavuti na kupitia programu za simu za mkononi kwenye iOS na Android. Mbinu ya Alibaba inaonyesha kuwa hata makampuni makubwa ya teknolojia yanaweza kutumia kimkakati chanzo huria kukuza uvumbuzi, kujenga jumuiya, na kushindana kwa ufanisi kwenye jukwaa la kimataifa la AI.

Ernie ya Baidu: Mabadiliko ya Kimkakati kutoka kwa Jitu la Utafutaji

Baidu, ambayo mara nyingi hujulikana kama Google ya China kutokana na utawala wake katika soko la injini za utafutaji, inaleta aina tofauti ya urithi kwenye mbio za AI. Tofauti na DeepSeek au hata msukumo wa hivi karibuni wa LLM wa Alibaba, Baidu imekuwa ikihusika sana katika utafiti wa AI, hasa katika usindikaji wa lugha asilia, kwa miaka mingi. Mfululizo wake wa modeli za ERNIE (Enhanced Representation through Knowledge Integration) ulianza mwaka 2019, kabla ya msukumo wa utoaji wa umma uliochochewa na ChatGPT.

Msukumo wa AI ya uzalishaji unaoelekezwa kwa umma ulianza kwa dhati na kutolewa kwa Ernie 3.0 LLM mnamo Machi 2023, ikifuatiwa na Ernie 3.5 mnamo Juni 2023. Hapo awali, Baidu ilipitisha mbinu ya kawaida zaidi ya viwango, sawa na baadhi ya wenzao wa Magharibi. Ernie 4.0 ya hali ya juu zaidi, iliyotolewa Oktoba 2023, ilikuwa imehifadhiwa kimsingi kwa bidhaa za Baidu zinazotegemea usajili, wakati Ernie 3.5 yenye uwezo iliendesha toleo la bure la chatbot yake, inayojulikana kama Ernie Bot.

Hata hivyo, mienendo ya ushindani ndani ya sekta ya AI, inayojulikana na maendeleo ya haraka kutoka kwa wapinzani (wa ndani na wa kimataifa) na kuongezeka kwa uwezekano wa mikakati ya chanzo huria, pamoja na uwezekano wa kupungua kwa gharama za uzalishaji wa modeli, inaonekana kusababisha mabadiliko makubwa ya kimkakati. Baidu ilionyesha mabadiliko ya wazi kuelekea uwazi zaidi. Ingawa modeli za sasa za Ernie zinazoendesha huduma zake kuu hazikuwa chanzo huria mwanzoni, kampuni ilitangaza mipango ya kubadilisha mwelekeo huu kwa kiasi kikubwa.

Kutolewa kwa Ernie 4.5 LLM na modeli maalum ya hoja, Ernie X1, katikati ya Machi 2025, mara moja kulivuta ulinganisho na GPT-4.5 ya OpenAI na R1 ya DeepSeek, mtawalia, na kuiweka Baidu imara katika daraja la juu la watoa huduma za modeli za AI. Muhimu zaidi, pamoja na madai haya ya utendaji, Baidu ilitangaza ramani ya wazi kuelekea uwazi. Kampuni ilitangaza nia yake ya kufanya modeli zake za msingi kuwa chanzo huria kuanzia Juni 30. Zaidi ya hayo, ilitangaza kuwa chatbot yake ya Ernie Bot ingekuwa bure kwa watumiaji wote kuanzia Aprili 1, ikiondoa kizuizi cha awali cha usajili kwa kupata AI yake ya mazungumzo yenye uwezo zaidi. Kuangalia mbele, Baidu pia imeonyesha kuwa marudio yake makubwa yajayo, Ernie 5, yanayotarajiwa katika nusu ya pili ya 2025, vile vile yatakumbatia falsafa ya chanzo huria na matumizi ya bure.

Mwelekeo huu mpya wa kimkakati na mchezaji wa hadhi ya Baidu ni muhimu sana. Unapendekeza utambuzi kwamba uwazi unaweza kuwa unakuwa hitaji la ushindani, sio tu njia mbadala. Kwa kufanya modeli zake za hali ya juu zipatikane bure, Baidu inasimama kukuza jumuiya ya watengenezaji, kuchochea uvumbuzi karibu na jukwaa lake, na uwezekano wa kukamata sehemu kubwa ya akili miongoni mwa watumiaji wanaotafuta zana za AI zenye nguvu, zisizo na vizuizi.

Kama washindani wake, kiolesura kikuu cha mtumiaji cha Ernie ni chatbot, inayopatikana kupitia wavuti na programu za simu za mkononi (iOS na Android). Uwezo wa Ernie pia umeingia katika bidhaa za watumiaji zinazoonekana, hasa kwa kujumuishwa katika vipengele vya AI vya toleo la kimataifa la simu janja ya Samsung Galaxy S24. Ujumuishaji huu unatoa mfano halisi wa jinsi modeli hizi za lugha za hali ya juu zinavyohama kutoka kwenye maabara za utafiti na violesura vya wavuti hadi kwenye vifaa ambavyo mamilioni hutumia kila siku. Mkakati unaobadilika wa Baidu unasisitiza hali ya kubadilika ya mandhari ya AI, ambapo hata makampuni makubwa yaliyoimarika yanabadilisha mbinu zao kujibu maendeleo ya kiteknolojia na mabadiliko ya matarajio ya soko.

Kuabiri Ulimwengu Unaopanuka wa AI

Kuibuka kwa modeli za AI zenye nguvu na zinazopatikana kutoka DeepSeek, Alibaba, na Baidu kunaashiria zaidi ya ushindani ulioongezeka tu kwa wachezaji walioimarika kama OpenAI na Google. Inawakilisha upanuzi wa kimsingi wa chaguo na fursa kwa anuwai ya watumiaji na watengenezaji. Upatikanaji wa modeli hizi, mara nyingi chini ya leseni ruhusu za chanzo huria au ‘open weight’, hupunguza kwa kiasi kikubwa kizuizi cha kuingia kwa uvumbuzi. Biashara ndogo ndogo, watengenezaji binafsi, watafiti, na wanafunzi sasa wanaweza kupata na kutumia uwezo wa AI ambao hapo awali ulikuwa umefungiwa kwa mashirika makubwa au viwango vya gharama kubwa vya usajili.

Kuenea huku kunachochea mienendo kadhaa chanya:

  • Ubinafsishaji: Watengenezaji wanaweza kuboresha modeli hizi huria kwenye seti maalum za data ili kuunda zana za AI maalum sana zilizolengwa kwa ajili ya viwanda maalum au kazi za kipekee, zikivuka suluhisho za jumla, za ukubwa mmoja kwa wote.
  • Majaribio: Uwezo wa kupakua na kurekebisha uzito wa modeli huruhusu uchunguzi wa kina wa usanifu na uwezo wa AI, kukuza utafiti wa kitaaluma na uvumbuzi wa msingi.
  • Upunguzaji wa Gharama: Kwa watumiaji na mashirika yaliyochoshwa na ada za usajili zinazojirudia, njia hizi mbadala za bure au za gharama nafuu hutoa utendaji wenye nguvu bila mzigo wa kifedha unaohusiana, uwezekano wa kudemokrasisha upatikanaji wa zana za AI zinazoongeza tija.
  • Ukuaji wa Mfumo-Ikolojia: Upatikanaji kupitia majukwaa kama GitHub na Hugging Face unakuza jumuiya zenye nguvu karibu na modeli hizi, ukitoa rasilimali za pamoja, usaidizi, na fursa za maendeleo shirikishi.

Hata hivyo, kuabiri ulimwengu huu uliopanuka kunahitaji uzingatiaji makini. Kuchagua modeli ya AI kunahusisha zaidi ya kulinganisha tu vigezo vya utendaji. Mambo kama vile ubora na upatikanaji wa nyaraka, mwitikio wa jumuiya ya watengenezaji, nguvu na udhaifu maalum wa modeli (k.m., ustadi wa kuandika msimbo dhidi ya uandishi wa ubunifu dhidi ya uelewa wa aina nyingi), na rasilimali za kompyuta zinazohitajika kuendesha au kuboresha modeli kwa ufanisi yote ni vipengele muhimu katika mchakato wa kufanya maamuzi. Ingawa majukwaa ya wingu hutoa rasilimali zinazoweza kuongezeka, uwezekano wa kuendesha modeli zenye nguvu ndani ya nchi kwenye vifaa vyenye uwezo ni pendekezo la kuvutia linalowezeshwa na baadhi ya matoleo huria.

Zaidi ya hayo, kuongezeka kwa njia hizi mbadala zenye nguvu bila shaka kunazua maswali ya kimkakati kwa wachezaji waliopo. Je, shinikizo kutoka kwa modeli za chanzo huria za hali ya juu litawalazimisha makampuni makubwa ya AI ya Magharibi kupitisha mikakati wazi zaidi wenyewe, labda kwa kutoa modeli za zamani au kutoa viwango vya bure vya ukarimu zaidi? Au watajikita zaidi katika vipengele vya umiliki, kufungia mfumo-ikolojia, na suluhisho zinazolenga biashara ili kudumisha makali yao? Mwingiliano wa ushindani ni wenye nguvu na unabadilika kila wakati.

Mwelekeo wa kijiografia pia unaongeza utata, kwani maendeleo ya uwezo wa AI wa hali ya juu nje ya vituo vya jadi vya Magharibi hubeba athari kubwa za muda mrefu kwa uongozi wa kiteknolojia na viwango vya kimataifa. Kadiri zana hizi zenye nguvu zinavyosambazwa kwa upana zaidi, mijadala kuhusu maendeleo ya AI yenye uwajibikaji, miongozo ya kimaadili, na matumizi mabaya yanayoweza kutokea pia inakuwa muhimu zaidi kwa wachezaji wote, bila kujali asili yao au mfumo wa leseni. Mbio za AI bila shaka zimepanuka, zikitoa mandhari tajiri zaidi, yenye utata zaidi, na hatimaye inayopatikana zaidi kuliko hapo awali. Changamoto na fursa sasa ziko katika kutumia uwezo huu uliopanuka kwa uwajibikaji na kwa ufanisi.