Mwelekeo wa Meta’s Llama large language model (LLM) umekuwa mada ya uchunguzi mkubwa na mjadala ndani ya jumuiya ya akili bandia. Takriban mwaka mmoja ulitenganisha toleo la Llama 3 na Llama 4, umilele katika mazingira yanayobadilika kwa kasi ya AI. Ingawa awali ilisifiwa kama mbadala wa chanzo huria kwa mifumo ya umiliki kama vile matoleo ya OpenAI, maendeleo ya hivi majuzi yanaonyesha mabadiliko katika mtazamo, huku wengine wakitilia shaka umuhimu unaoendelea wa Llama katika mstari wa mbele wa uvumbuzi wa AI.
Kukatishwa Tamaa kwa LlamaCon na Matarajio Yanayobadilika
Katika LlamaCon, mkutano wa kwanza wa Meta uliotolewa kwa LLM zake za chanzo huria, hisia ya matarajio ambayo hayajatimizwa ilijaa anga. Wasanidi programu kadhaa waliohudhuria walisema kwamba walikuwa wametarajia kufunuliwa kwa mfumo wa kisasa wa hoja, au angalau mfumo wa jadi unaoweza kuwashinda washindani kama vile DeepSeek’s V3 na Qwen, ambaye ni mkusanyiko wa mifumo iliyotengenezwa na kitengo cha kompyuta ya wingu cha Alibaba.
Kukosekana kwa matangazo kama hayo kulizalisha wasiwasi kwamba Llama alikuwa akipoteza ardhi katika mbio za ukuu wa AI. Mwezi mmoja tu kabla ya mkutano, Meta alikuwa amezindua kizazi cha nne cha familia yake ya Llama, ikiwa ni pamoja na mifumo ya wazi ya uzito Llama 4 Scout na Llama 4 Maverick. Scout iliundwa kwa ajili ya utendaji bora kwenye GPU moja, huku Maverick iliundwa kama mfumo mkubwa wa kushindana na mifumo mingine ya msingi.
Mbali na Scout na Maverick, Meta alitoa mwonekano wa Llama 4 Behemoth, “mfumo mkuu” mwingine mkubwa zaidi ambao bado unafanyiwa mafunzo. Madhumuni ya Behemoth ni kuwezesha uchujaji, mbinu ya kuunda mifumo midogo, maalum kutoka kwa kubwa, ya jumla zaidi.
Hata hivyo, ripoti ziliibuka zikionyesha ucheleweshaji katika kutolewa kwa Behemoth na changamoto katika kufikia utendaji shindani na mfumo wa Llama 4. Licha ya madai ya Meta ya uwezo wa hali ya juu, mtazamo miongoni mwa wasanidi programu wengine ulikuwa kwamba Llama hakuwa tena anaongoza pakiti.
Kupanda kwa Washindani: Qwen na DeepSeek
Kukatishwa tamaa kuzunguka LlamaCon na mifumo ya Llama 4 kunaonyesha hisia pana kwamba LLM za chanzo huria za Meta zinapoteza kasi katika suala la utendaji wa kiufundi na shauku ya wasanidi programu. Ingawa Meta anasisitiza kujitolea kwake kwa kanuni za chanzo huria, ujenzi wa mfumo ikolojia, na uvumbuzi, washindani kama vile DeepSeek, Qwen, na OpenAI wanaendelea kwa kasi katika maeneo muhimu kama vile hoja, matumizi ya zana, na utumiaji wa ulimwengu halisi.
Msanidi programu mmoja, Vineeth Sai Varikuntla, alielezea kukatishwa tamaa kwake, akisema kwamba alitumai Llama atawashinda Qwen na DeepSeek katika kesi za matumizi ya jumla na hoja, lakini aligundua Qwen kuwa mbele kwa kiasi kikubwa.
Hisia hii inaonyesha changamoto ambazo Meta anakabiliana nazo katika kudumisha msimamo wa Llama kama LLM inayoongoza ya chanzo huria. Ingawa matoleo ya awali ya Llama yalipata usikivu na sifa kubwa, kuibuka kwa njia mbadala zenye uwezo mkubwa kumeongeza mazingira ya ushindani.
Mwanzo Wenye Matumaini: Athari ya Llama 2
Ili kutambua kikamilifu simulizi ya sasa inayozunguka Llama, ni muhimu kukumbuka asili yake na msisimko wa awali iliozalisha. Mnamo 2023, Mkurugenzi Mtendaji wa Nvidia Jensen Huang alisifu uzinduzi wa Llama 2 kama “labda tukio kubwa zaidi katika AI” la mwaka huo. Kufikia Julai 2024, kutolewa kwa Llama 3 kulizingatiwa mafanikio, kuwakilisha LLM ya kwanza ya wazi yenye uwezo wa kupinga utawala wa OpenAI.
Kuwasili kwa Llama 3 kulisababisha ongezeko la haraka la mahitaji ya nguvu ya kompyuta, na kusababisha kuongezeka kwa bei za kukodisha GPU, kulingana na Dylan Patel, mchambuzi mkuu wa SemiAnalysis. Utafutaji wa Google wa “Meta” na “Llama” pia ulifikia kilele katika kipindi hiki, kuonyesha nia pana katika mfumo mpya.
Llama 3 ilisherehekewa kama LLM iliyotengenezwa na Amerika, iliyo wazi, na ya kiwango cha juu. Ingawa haikuongoza mara kwa mara vigezo vya tasnia, ilitoa ushawishi mkubwa na umuhimu ndani ya jumuiya ya AI. Hata hivyo, mienendo hii imebadilika hatua kwa hatua.
Mabadiliko ya Usanifu na Ukosoaji
Mifumo ya Llama 4 ilianzisha usanifu wa “mchanganyiko wa wataalamu”, muundo uliofanywa maarufu na DeepSeek. Usanifu huu huwezesha mfumo kuamilisha utaalamu muhimu tu kwa kazi maalum, na hivyo kuboresha ufanisi.
Hata hivyo, kutolewa kwa Llama 4 kulikutana na ukosoaji wakati wasanidi programu waligundua kwamba toleo lililotumika kwa uwekaji alama wa umma lilitofautiana na toleo lililopatikana kwa kupakuliwa na kupelekwa. Tofauti hii ilisababisha shutuma za “kucheza na ubao wa wanaoongoza,” ambazo Meta alizikana, akisema kwamba lahaja inayohusika ilikuwa ya majaribio na kwamba kutathmini matoleo mengi ya mfumo ni mazoezi ya kawaida.
Licha ya maelezo ya Meta, utata huo ulichangia mtazamo kwamba Llama alikuwa akihangaika kudumisha ukingo wake wa ushindani. Huku mifumo shindani ikiendelea kusonga mbele, Meta alionekana kukosa mwelekeo wazi.
Kupima Ufuatiliaji wa Wasanidi Programu: Kazi Ngumu
Kuamua ni familia ipi ya LLM inayoshikiliwa zaidi kati ya wasanidi programu ni kazi ngumu. Hata hivyo, data inayopatikana inaonyesha kwamba mifumo ya hivi karibuni ya Llama haimo kati ya viongozi.
Qwen, hasa, mara kwa mara iko juu kwenye bao mbalimbali za wanaoongoza kwenye mtandao. Kulingana na Artificial Analysis, tovuti ambayo hupanga mifumo kulingana na utendaji, Llama 4 Maverick na Scout ziko juu kidogo ya mfumo wa OpenAI wa GPT-4 (iliyotolewa mwishoni mwa mwaka uliopita) na chini ya Grok ya xAI na Claude ya Anthropic katika suala la akili.
OpenRouter, jukwaa ambalo huwapa wasanidi programu ufikiaji wa mifumo mbalimbali na huchapisha bao za wanaoongoza kulingana na matumizi ya API, inaonyesha Llama 3.3 kati ya mifumo 20 bora kufikia mapema Mei, lakini sio Llama 4.
Pointi hizi za data, ingawa sio za uhakika, zinaonyesha kwamba marudio ya hivi karibuni ya Llama hayajafurahishwa sana na wasanidi programu kama watangulizi wao.
Zaidi ya Vigezo: Matumizi ya Zana na Hoja
Ingawa tathmini za kawaida za Llama 4 zinaweza kuwa hazikuendana, wataalam wanasema kwamba shauku iliyonyamazishwa inatokana na sababu zaidi ya vipimo vya utendaji mbichi.
AJ Kourabi, mchambuzi wa SemiAnalysis, anasisitiza umuhimu wa “kupiga simu ya zana” na uwezo wa mfumo kuenea zaidi ya utendaji rahisi wa chatbot. Kupiga simu ya zana kunarejelea uwezo wa mfumo wa kufikia na kuagiza programu zingine kwenye mtandao au kwenye kifaa cha mtumiaji, kipengele muhimu kwa AI ya wakala, ambayo inaahidi kuhuisha kazi kama vile kuweka nafasi ya kusafiri na kudhibiti gharama.
Meta amesema kwamba mifumo ya Llama inasaidia kupiga simu ya zana kupitia API yake. Hata hivyo, Theo Browne, msanidi programu na YouTuber, anasema kwamba kupiga simu ya zana imekuwa lazima kwa umuhimu wa hali ya juu huku zana za wakala zinavyopata umaarufu.
Anthropic ameibuka kama kiongozi wa mapema katika matumizi ya zana, na mifumo ya umiliki kama vile OpenAI inakwenda kwa kasi. Uwezo wa kuaminika wa kupiga simu ya zana sahihi ili kutoa majibu sahihi ni muhimu sana, na OpenAI imehamisha lengo lake ili kuweka kipaumbele uwezo huu.
Kourabi anasema kwamba kukosekana kwa mfumo thabiti wa hoja ni kiashiria muhimu kwamba Meta ameanguka nyuma. Hoja inachukuliwa kuwa kipengele cha msingi katika mlinganyo wa AI wa wakala, kuwezesha mifumo kuchambua kazi na kuamua hatua inayofaa kuchukuliwa.
Niche ya Llama: Matumizi ya Vitendo na Ufuatiliaji wa Biashara
Licha ya wasiwasi kuhusu msimamo wake katika mstari wa mbele wa utafiti wa AI, Llama inabaki kuwa zana muhimu kwa wasanidi programu wengi na mashirika.
Nate Jones, mkuu wa bidhaa katika RockerBox, anawashauri wasanidi programu kujumuisha Llama kwenye wasifu wao, kwani ujuzi na mfumo huo huenda utatafutwa katika siku zijazo.
Paul Baier, Mkurugenzi Mtendaji na mchambuzi mkuu wa GAI Insights, anaamini kwamba Llama itaendelea kuwa sehemu muhimu ya mikakati ya AI kwa kampuni nyingi, hasa zile zilizo nje ya sekta ya teknolojia.
Biashara zinatambua umuhimu wa mifumo ya chanzo huria, huku Llama akiwa mfano maarufu, kwa kushughulikia kazi zisizo ngumu sana na kudhibiti gharama. Mashirika mengi hupendelea mchanganyiko wa mifumo iliyofungwa na iliyo wazi ili kukidhi mahitaji yao mbalimbali.
Baris Gultekin, mkuu wa AI katika Snowflake, anabainisha kuwa wateja mara nyingi hutathmini mifumo kulingana na kesi zao mahususi za matumizi badala ya kutegemea tu vigezo. Kutokana na gharama yake ya chini, Llama mara nyingi inathibitika kuwa inatosha kwa matumizi mengi.
Katika Snowflake, Llama hutumiwa kwa kazi kama vile kufupisha nakala za simu za mauzo na kutoa maelezo yaliyoandaliwa kutoka kwa ukaguzi wa wateja. Katika Dremio, Llama hutengeneza msimbo wa SQL na huandika barua pepe za uuzaji.
Tomer Shiran, mwanzilishi mwenza na afisa mkuu wa bidhaa wa Dremio, anapendekeza kwamba mfumo mahususi huenda usihitajike kwa 80% ya matumizi, kwani mifumo mingi sasa “imeiva” ya kutosha kukidhi mahitaji ya kimsingi.
Mandhari Tofauti: Jukumu Imara la Llama
Ingawa Llama anaweza kuwa anaondoka kwenye ushindani wa moja kwa moja na mifumo ya umiliki katika maeneo fulani, mandhari ya jumla ya AI inakuwa tofauti zaidi, na jukumu la Llama linaimarika ndani ya niches maalum。
Shiran anasisitiza kwamba vigezo sio msingi mkuu wa chaguo la mfumo, kwani watumiaji huweka kipaumbele upimaji wa mifumo kwenye kesi zao za matumizi. Utendaji wa mfumo kwenye data ya mteja ni muhimu sana, na utendaji huu unaweza kutofautiana baada ya muda.
Gultekin anaongeza kuwa uteuzi wa mfumo mara nyingi ni uamuzi mahususi wa kesi za matumizi badala ya tukio la mara moja.
Llama anaweza kuwa anapoteza wasanidi programu ambao wanatafuta mara kwa mara maendeleo ya hivi karibuni, lakini anabakisha msaada wa wasanidi programu wengi wanaozingatia kujenga zana za vitendo za AI.
Mienendo hii inalingana na mkakati mkuu wa chanzo huria wa Meta, ulioonyeshwa na uzinduzi wa React mnamo 2013 na uundaji wa PyTorch mnamo 2016. Kwa kukuza mifumo ikolojia iliyofanikiwa, Meta anafaidika kutokana na michango ya jumuiya ya chanzo huria.
Kama Nate Jones anavyoona, Zuckerberg anapata upepo mkubwa kutoka kwa mipango ya chanzo huria ya Meta.