Meta Yazindua Llama 4: Kizazi Kipya cha Miundo ya AI

Meta Platforms, kampuni kubwa ya teknolojia iliyo nyuma ya Facebook, Instagram, na WhatsApp, imeimarisha kwa kiasi kikubwa nafasi yake katika uwanja wa akili bandia (AI) kwa kuanzisha mfululizo wake wa Llama 4. Uzinduzi huu unaashiria awamu inayofuata ya familia mashuhuri ya kampuni ya miundo wazi ya Llama, ikionyesha dhamira endelevu ya kushindana mstari wa mbele katika maendeleo ya AI na uwezekano wa kuunda upya mienendo ya ushindani ndani ya sekta hiyo. Uzinduzi huu unaleta miundo mitatu tofauti, kila moja ikiwa imeundwa kwa uwezo maalum na usanifu wa kikokotozi, ikilenga kuhudumia matumizi mbalimbali kuanzia utendaji wa jumla wa mazungumzo hadi kazi ngumu za uchakataji data.

Kuanzisha Familia ya Llama 4: Scout, Maverick, na Behemoth

Uzinduzi wa awali wa kizazi cha Llama 4 unajumuisha miundo mitatu iliyopewa majina maalum: Llama 4 Scout, Llama 4 Maverick, na Llama 4 Behemoth ambayo bado iko katika maendeleo. Meta imeonyesha kuwa msingi wa miundo hii unategemea seti kubwa za data za mafunzo zinazojumuisha kiasi kikubwa cha maandishi, picha, na maudhui ya video yasiyo na lebo. Mbinu hii ya mafunzo ya multimodal inakusudiwa kuipa miundo uelewa wa kisasa na ‘mpana wa kuona,’ kupanua uwezo wao zaidi ya mwingiliano wa maandishi tu.

Mwelekeo wa maendeleo wa Llama 4 unaonekana kuathiriwa na shinikizo la ushindani ndani ya sekta ya AI inayobadilika haraka. Ripoti zinaonyesha kuwa kuibuka na ufanisi wa ajabu wa miundo wazi kutoka kwa maabara za kimataifa za AI, hasa ikitaja maabara ya Kichina ya DeepSeek, kuliifanya Meta kuharakisha juhudi zake za maendeleo. Inaeleweka kuwa Meta ilitumia rasilimali kubwa, ikiwezekana kuanzisha timu maalum au ‘vyumba vya vita,’ kuchambua na kuelewa mbinu zilizotumiwa na washindani kama DeepSeek, hasa ikilenga mbinu zilizofanikiwa kupunguza gharama za kikokotozi zinazohusiana na kuendesha na kupeleka miundo ya hali ya juu ya AI. Msukumo huu wa ushindani unaangazia mbio kali kati ya wachezaji wakuu wa teknolojia na taasisi za utafiti ili kufikia mafanikio katika utendaji wa AI na ufanisi wa uendeshaji.

Upatikanaji unatofautiana katika safu mpya ya Llama 4. Scout na Maverick zinafanywa kupatikana kwa uwazi kwa jamii ya wasanidi programu na umma kupitia njia zilizoanzishwa, ikiwa ni pamoja na tovuti ya Meta ya Llama.com na majukwaa ya washirika kama vile kitovu kinachotumika sana cha maendeleo ya AI, Hugging Face. Upatikanaji huu wazi unasisitiza mkakati wa Meta wa kukuza mfumo mpana zaidi unaozunguka miundo yake ya Llama. Hata hivyo, Behemoth, iliyowekwa kama mfumo wenye nguvu zaidi katika mfululizo wa sasa, bado iko chini ya maendeleo na bado haijatolewa kwa matumizi ya jumla. Wakati huo huo, Meta inaunganisha uwezo huu mpya katika bidhaa zake zinazowakabili watumiaji. Kampuni ilitangaza kuwa msaidizi wake wa AI, Meta AI, ambayo inafanya kazi katika programu zake kama WhatsApp, Messenger, na Instagram, imeboreshwa ili kutumia nguvu ya Llama 4. Ujumuishaji huu unaenezwa katika nchi arobaini, ingawa vipengele vya hali ya juu vya multimodal (vinavyochanganya maandishi, picha, na uwezekano wa aina nyingine za data) awali vimewekewa vikwazo kwa watumiaji wa lugha ya Kiingereza nchini Marekani.

Kuabiri Mazingira ya Leseni

Licha ya msisitizo juu ya uwazi kwa baadhi ya miundo, upelekaji na matumizi ya Llama 4 yanasimamiwa na masharti maalum ya leseni ambayo yanaweza kuleta vikwazo kwa wasanidi programu na mashirika fulani. Kizuizi kimoja mashuhuri kinakataza waziwazi watumiaji na kampuni zilizo na makao makuu au sehemu kuu ya biashara ndani ya Umoja wa Ulaya (European Union) kutumia au kusambaza miundo ya Llama 4. Kizuizi hiki cha kijiografia kinawezekana kuwa matokeo ya moja kwa moja ya mahitaji magumu ya utawala yaliyoamriwa na Sheria kamili ya AI ya EU (EU’s comprehensive AI Act) na kanuni zilizopo za faragha ya data kama GDPR. Kuabiri mifumo hii tata ya udhibiti inaonekana kuwa jambo muhimu linalounda mkakati wa upelekaji wa Meta katika eneo hilo.

Zaidi ya hayo, ikirudia muundo wa leseni wa matoleo ya awali ya Llama, Meta inaweka sharti kwa makampuni makubwa. Kampuni zinazojivunia kuwa na watumiaji zaidi ya milioni 700 wanaotumia kila mwezi zinahitajika kuomba rasmi leseni maalum moja kwa moja kutoka kwa Meta. Muhimu zaidi, uamuzi wa kutoa au kukataa leseni hii unabaki kabisa ndani ya ‘budi pekee’ ya Meta. Kifungu hiki kwa ufanisi kinaipa Meta udhibiti juu ya jinsi miundo yake ya hali ya juu zaidi inavyotumiwa na makampuni makubwa ya teknolojia yanayoweza kuwa washindani, ikidumisha kiwango cha usimamizi wa kimkakati licha ya asili ‘wazi’ ya sehemu za mfumo wa ikolojia wa Llama. Hila hizi za leseni zinasisitiza mwingiliano tata kati ya kukuza uvumbuzi wazi na kuhifadhi udhibiti wa kimkakati katika uwanja wa AI wenye ushindani mkubwa.

Katika mawasiliano yake rasmi yaliyoambatana na uzinduzi huo, Meta iliweka uzinduzi wa Llama 4 kama wakati muhimu. ‘Miundo hii ya Llama 4 inaashiria mwanzo wa enzi mpya kwa mfumo wa ikolojia wa Llama,’ kampuni ilisema katika chapisho la blogi, ikiongeza zaidi, ‘Huu ni mwanzo tu kwa mkusanyiko wa Llama 4.’ Taarifa hii inayoangalia mbele inapendekeza ramani ya maendeleo endelevu na upanuzi ndani ya kizazi cha Llama 4, ikiweka uzinduzi huu sio kama kituo cha mwisho bali kama hatua muhimu katika safari inayoendelea ya maendeleo ya AI.

Ubunifu wa Usanifu: Mbinu ya Mchanganyiko wa Wataalamu (MoE)

Tabia muhimu ya kiufundi inayotofautisha mfululizo wa Llama 4 ni kupitishwa kwake kwa usanifu wa Mchanganyiko wa Wataalamu (Mixture of Experts - MoE). Meta inaangazia kuwa hii ndiyo kundi la kwanza ndani ya familia ya Llama kutumia dhana hii maalum ya usanifu. Mbinu ya MoE inawakilisha mabadiliko makubwa katika jinsi miundo mikubwa ya lugha inavyoundwa na kufunzwa, ikitoa faida kubwa katika suala la ufanisi wa kikokotozi, wakati wa awamu ya mafunzo inayotumia rasilimali nyingi na wakati wa awamu ya uendeshaji inapojibu maswali ya watumiaji.

Katika msingi wake, usanifu wa MoE hufanya kazi kwa kugawanya kazi ngumu za uchakataji data kuwa kazi ndogo ndogo, zinazoweza kudhibitiwa zaidi. Kazi hizi ndogo kisha huelekezwa kwa akili au kukabidhiwa kwa mkusanyiko wa vipengele vidogo maalum vya mtandao wa neva, vinavyojulikana kama ‘wataalamu.’ Kila mtaalamu kwa kawaida hufunzwa kufanya vizuri katika aina maalum za data au kazi. Utaratibu wa lango (gating mechanism) ndani ya usanifu huamua ni mtaalamu gani au mchanganyiko gani wa wataalamu unaofaa zaidi kushughulikia sehemu fulani ya data ya ingizo au swali. Hii inatofautiana na usanifu wa jadi wa miundo minene (dense model architectures) ambapo mfumo mzima huchakata kila sehemu ya ingizo.

Faida za ufanisi zinatokana na ukweli kwamba ni sehemu ndogo tu ya vigezo vyote vya mfumo (vigezo ‘vinavyotumika’ vya wataalamu waliochaguliwa) ndivyo vinavyohusika kwa kazi yoyote ile. Uanzishaji huu wa kuchagua hupunguza kwa kiasi kikubwa mzigo wa kikokotozi ikilinganishwa na kuamsha mfumo mzima mkubwa na mnene.

Meta ilitoa maelezo maalum yanayoonyesha usanifu huu ukifanya kazi:

  • Maverick: Mfumo huu una idadi kubwa ya vigezo jumla ya bilioni 400. Hata hivyo, shukrani kwa muundo wa MoE unaojumuisha ‘wataalamu’ 128 tofauti, ni vigezo bilioni 17 tu vinavyotumika kikamilifu wakati wowote wakati wa uchakataji. Vigezo mara nyingi huchukuliwa kama kiwakilishi kibaya cha uwezo wa mfumo wa kujifunza na utata wa kutatua matatizo.
  • Scout: Ukiwa umeundwa vivyo hivyo, Scout una vigezo jumla bilioni 109 vilivyosambazwa kwa ‘wataalamu’ 16, na kusababisha vigezo vinavyotumika bilioni 17 sawa na Maverick.

Chaguo hili la usanifu linaruhusu Metakujenga miundo yenye uwezo mkubwa kwa ujumla (idadi kubwa ya vigezo jumla) huku ikidumisha mahitaji ya kikokotozi yanayoweza kudhibitiwa kwa ajili ya inference (uchakataji wa maswali), na kuwafanya kuwa wa vitendo zaidi kupeleka na kuendesha kwa kiwango kikubwa.

Alama za Utendaji na Utaalamu wa Miundo

Meta imeweka miundo yake mipya kwa ushindani, ikitoa matokeo ya alama za ndani yanayolinganisha Llama 4 dhidi ya miundo mashuhuri kutoka kwa wapinzani kama OpenAI, Google, na Anthropic.

Maverick, iliyoteuliwa na Meta kama bora kwa matumizi ya ‘msaidizi wa jumla na mazungumzo,’ ikiwa ni pamoja na kazi kama uandishi wa ubunifu na uzalishaji wa msimbo, inaripotiwa kuonyesha utendaji bora ikilinganishwa na miundo kama GPT-4o ya OpenAI na Gemini 2.0 ya Google kwenye alama maalum. Alama hizi zinashughulikia maeneo kama ustadi wa kuandika msimbo, hoja za kimantiki, uwezo wa lugha nyingi, kushughulikia mfuatano mrefu wa maandishi (long-context), na uelewa wa picha. Hata hivyo, data ya Meta yenyewe inaonyesha kuwa Maverick haizidi kila wakati uwezo wa miundo ya hivi karibuni na yenye nguvu zaidi inayopatikana kwa sasa, kama vile Gemini 2.5 Pro ya Google, Claude 3.7 Sonnet ya Anthropic, au GPT-4.5 inayotarajiwa ya OpenAI. Hii inapendekeza Maverick inalenga nafasi imara katika daraja la utendaji wa juu lakini huenda isidai nafasi ya juu kabisa katika vipimo vyote dhidi ya miundo mipya kabisa ya washindani.

Scout, kwa upande mwingine, imeundwa kwa nguvu tofauti. Uwezo wake unaangaziwa katika kazi zinazohusisha ufupishaji wa nyaraka ndefu na hoja juu ya misingi mikubwa na tata ya msimbo. Kipengele cha kipekee na kinachofafanua cha Scout ni dirisha lake kubwa la muktadha (context window), lenye uwezo wa kushughulikia hadi tokeni milioni 10. Tokeni ni vitengo vya msingi vya maandishi au msimbo ambavyo miundo ya lugha huchakata (k.m., neno linaweza kugawanywa katika tokeni kadhaa kama ‘ku-ele-wa’). Dirisha la muktadha la tokeni milioni 10 linatafsiriwa, kwa maneno ya vitendo, kuwa na uwezo wa kupokea na kuchakata kiasi kikubwa cha habari kwa wakati mmoja - uwezekano sawa na mamilioni ya maneno au maktaba nzima ya msimbo. Hii inaruhusu Scout kudumisha mshikamano na uelewa katika nyaraka ndefu sana au miradi tata ya programu, jambo ambalo ni changamoto kwa miundo yenye madirisha madogo ya muktadha. Inaweza pia kuchakata picha pamoja na ingizo hili kubwa la maandishi.

Mahitaji ya vifaa vya kuendesha miundo hii yanaakisi ukubwa na usanifu wao. Kulingana na makadirio ya Meta:

  • Scout ni yenye ufanisi kiasi, ina uwezo wa kuendeshwa kwenye GPU moja ya hali ya juu ya Nvidia H100.
  • Maverick, pamoja na idadi yake kubwa ya vigezo jumla licha ya ufanisi wa MoE, inahitaji rasilimali kubwa zaidi, ikihitaji mfumo wa Nvidia H100 DGX (ambao kwa kawaida huwa na GPU nyingi za H100) au nguvu sawa ya kikokotozi.

Mfumo ujao wa Behemoth unatarajiwa kuhitaji miundombinu ya vifaa vikubwa zaidi. Meta ilifunua kuwa Behemoth imeundwa na vigezo vinavyotumika bilioni 288 (kati ya karibu vigezo jumla trilioni mbili, vilivyosambazwa kwa wataalamu 16). Alama za awali za ndani zinaweka Behemoth kama inayozidi utendaji wa miundo kama GPT-4.5, Claude 3.7 Sonnet, na Gemini 2.0 Pro (ingawa, kwa kuzingatia, sio Gemini 2.5 Pro ya hali ya juu zaidi) katika tathmini kadhaa zinazozingatia ujuzi wa STEM (Sayansi, Teknolojia, Uhandisi, na Hisabati), hasa katika maeneo kama utatuzi wa matatizo magumu ya kihisabati.

Inafaa kuzingatia, hata hivyo, kwamba hakuna hata moja ya miundo ya Llama 4 iliyotangazwa kwa sasa imeundwa waziwazi kama miundo ya ‘hoja’ (reasoning models) kwa mtindo wa dhana za maendeleo za OpenAI za o1 na o3-mini. Miundo hii maalum ya hoja kwa kawaida hujumuisha mifumo ya ukaguzi wa ukweli wa ndani na uboreshaji wa majibu yao kwa kurudia, na kusababisha majibu yanayoweza kuwa ya kuaminika zaidi na sahihi, hasa kwa maswali ya ukweli. Malipo yake mara nyingi ni kuongezeka kwa muda wa kusubiri (latency), ikimaanisha zinachukua muda mrefu kutoa majibu ikilinganishwa na miundo mikubwa ya lugha ya jadi kama ile iliyo katika familia ya Llama 4, ambayo inatanguliza uzalishaji wa haraka zaidi.

Kurekebisha Mipaka ya Mazungumzo: Mada Zenye Utata

Kipengele cha kuvutia cha uzinduzi wa Llama 4 kinahusisha urekebishaji wa makusudi wa Meta wa tabia ya majibu ya miundo, hasa kuhusu mada nyeti au zenye utata. Kampuni ilisema waziwazi kuwa imerekebisha miundo ya Llama 4 kuwa na uwezekano mdogo wa kukataa kujibu maswali ‘yenye utata’ ikilinganishwa na watangulizi wao katika familia ya Llama 3.

Kulingana na Meta, Llama 4 sasa ina mwelekeo zaidi wa kujihusisha na mada za kisiasa na kijamii ‘zinazojadiliwa’ ambapo matoleo ya awali yangeweza kukwepa au kutoa kukataa kwa jumla. Zaidi ya hayo, kampuni inadai kuwa Llama 4 inaonyesha mbinu ‘yenye usawa zaidi kwa kiasi kikubwa’ kuhusu aina za vidokezo ambavyo itakataa kujihusisha navyo kabisa. Lengo lililotajwa ni kutoa majibu yenye msaada na ya ukweli bila kutoa hukumu.

Msemaji wa Meta alifafanua zaidi juu ya mabadiliko haya, akiiambia TechCrunch: ‘[Y]unaweza kutegemea [Llama 4] kutoa majibu yenye msaada, ya ukweli bila hukumu… [T]unaendelea kuifanya Llama iwe sikivu zaidi ili ijibu maswali zaidi, iweze kujibu mitazamo mbalimbali […] na isipendelee baadhi ya mitazamo kuliko mingine.’

Marekebisho haya yanatokea dhidi ya msingi wa mjadala unaoendelea wa umma na kisiasa unaozunguka upendeleo unaodhaniwa katika mifumo ya akili bandia. Baadhi ya makundi ya kisiasa na wachambuzi, ikiwa ni pamoja na watu mashuhuri wanaohusishwa na utawala wa Trump kama Elon Musk na mwekezaji wa mtaji David Sacks, wametoa shutuma kwamba chatbots maarufu za AI zinaonyesha upendeleo wa kisiasa, mara nyingi unaoelezewa kama ‘woke,’ wakidaiwa kudhibiti maoni ya kihafidhina au kuwasilisha habari iliyopindishwa kuelekea mtazamo wa kiliberali. Sacks, kwa mfano, amekosoa haswa ChatGPT ya OpenAI hapo awali, akidai ‘ilipangwa kuwa woke’ na isiyoaminika katika masuala ya kisiasa.

Hata hivyo, changamoto ya kufikia kutopendelea kwa kweli na kuondoa upendeleo katika AI inatambulika sana ndani ya jamii ya kiufundi kama tatizo gumu sana na linaloendelea (‘intractable’). Miundo ya AI hujifunza mifumo na uhusiano kutoka kwa seti kubwa za data wanazofunzwa nazo, na seti hizi za data bila shaka zinaakisi upendeleo uliopo katika maandishi na picha zilizotengenezwa na binadamu zilizomo. Juhudi za kuunda AI isiyo na upendeleo kabisa au isiyoegemea upande wowote kisiasa, hata na kampuni zinazolenga hilo waziwazi, zimethibitika kuwa ngumu. Mradi wa AI wa Elon Musk mwenyewe, xAI, umeripotiwa kukabiliwa na changamoto katika kuendeleza chatbot ambayo inaepuka kuidhinisha misimamo fulani ya kisiasa kuliko mingine.

Licha ya ugumu wa kiufundi uliopo, mwelekeo miongoni mwa wasanidi wakuu wa AI, ikiwa ni pamoja na Meta na OpenAI, unaonekana kuelekea kurekebisha miundo ili iwe na uwezekano mdogo wa kuepuka mada zenye utata. Hii inahusisha kurekebisha kwa uangalifu vichujio vya usalama (safety filters) na miongozo ya majibu ili kuruhusu ushiriki na anuwai pana ya maswali kuliko ilivyoruhusiwa hapo awali, huku bado ikijaribu kupunguza uzalishaji wa maudhui hatari au yenye upendeleo dhahiri. Urekebishaji huu mzuri unaakisi kitendo maridadi cha kusawazisha ambacho kampuni za AI lazima zifanye kati ya kukuza mjadala wazi, kuhakikisha usalama wa watumiaji, na kuabiri matarajio tata ya kijamii na kisiasa yanayozunguka teknolojia zao zenye nguvu. Uzinduzi wa Llama 4, pamoja na marekebisho yake yaliyotajwa waziwazi katika kushughulikia maswali yenye utata, unawakilisha hatua ya hivi karibuni ya Meta katika kuabiri mazingira haya tata.