Meta Llama, awali ilijulikana kama LLaMA (Large Language Model Meta AI), ilianza kuonekana mnamo Februari 2023, ikiashiria jaribio la Meta katika ulimwengu wa ushindani wa lugha kubwa (LLMs). Kutolewa kwa Llama 2 mnamo Julai 2023 kulikuwa kubadilisha mchezo, kwani Meta ilipitisha leseni ya wazi, ikitoa ufikiaji wa kidemokrasia na kukuza matumizi yaliyoenea. Kupitia uboreshaji endelevu na marudio mengi, Llama imeimarisha uwezo wake kwa kasi, ikiimarisha msimamo wake kati ya majitu ya tasnia kama OpenAI, Anthropic, na Google.
Familia ya Llama ilipanuka zaidi mnamo Aprili 5, 2025, na kuanzishwa kwa familia ya mfumo wa Llama 4, pia inajulikana kama kundi la Llama 4, ikitangaza enzi mpya ya LLMs za multimodal.
Meta Llama 4 ni Nini?
Meta Llama 4 inawakilisha hatua muhimu mbele katika teknolojia ya LLM, ikiwa na uwezo wa multimodal ambao huiwezesha kuchakata na kufasiri maandishi, picha, na data ya video. Mfumo huu wa kizazi cha nne unapita vizuizi vya lugha kwa kusaidia lugha nyingi kutoka ulimwenguni kote.
Ubunifu muhimu katika mifumo ya Llama 4 ni kupitishwa kwa usanifu wa mchanganyiko-wa-wataalam, wa kwanza kwa familia ya Llama. Usanifu huu huamilisha nguvu ndogo tu ya vigezo jumla kwa kila tokeni ya ingizo, kufikia usawa mzuri kati ya nguvu na ufanisi.
Wakati leseni ya jamii ya Llama 4 haitambuliwi rasmi kama leseni iliyoidhinishwa na Open Source Initiative, Meta inaelezea mifumo yake ya Llama 4 kama chanzo huria. Leseni inatoa matumizi ya bure na haki za urekebishaji kwa mifumo ya Llama 4, kulingana na mapungufu fulani. Kufikia Aprili 2025, kikomo kilikuwa kimewekwa kwa watumiaji milioni 700 kwa mwezi, ambapo leseni ya kibiashara inahitajika.
Mstari wa Llama 4 unajumuisha matoleo matatu ya msingi: Scout, Maverick, na Behemoth. Scout na Maverick zilizinduliwa kwa wakati mmoja, wakati Behemoth inasalia chini ya maendeleo. Mifumo hii inatofautiana sana katika uainishaji wao:
- Llama 4 Scout: Ina vigezo hai bilioni 17, wataalam 16, vigezo jumla bilioni 109, dirisha la muktadha la tokeni milioni 10, na kikomo cha ujuzi cha Agosti 2024.
- Llama 4 Maverick: Pia ina vigezo hai bilioni 17, lakini inajivunia wataalam 128, vigezo jumla bilioni 400, dirisha la muktadha la tokeni milioni 1, na kikomo sawa cha ujuzi kama Scout.
- Llama 4 Behemoth: Nguvu zaidi kati ya hizo tatu, ikiwa na vigezo hai bilioni 288, wataalam 16, vigezo jumla trilioni 2, na dirisha la muktadha isiyoainishwa na kikomo cha ujuzi.
Uwezo wa Meta Llama 4
Mifumo ya Meta Llama 4 inafungua wigo tofauti wa matumizi, pamoja na:
- Multimodality Asilia: Uwezo wa kuelewa wakati huo huo maandishi, picha, na video. Hii inaruhusu mfumo kupata muktadha na maana kutoka kwa vyanzo tofauti vya habari.
- Muhtasari wa Maudhui: Mifumo ya Llama 4 inaweza kufupisha habari kwa ufanisi kutoka kwa aina anuwai za maudhui, jambo muhimu la uelewaji wa multimodal. Kwa mfano, mfumo unaweza kuchambua video, kutoa pazia muhimu, na kutoa muhtasari mfupi wa maudhui.
- Uchakataji wa Muktadha Mrefu: Llama 4 Scout imeundwa mahsusi kuchakata idadi kubwa ya habari, kuwezeshwa na dirisha lake la muktadha la tokeni milioni 10. Uwezo huu ni muhimu sana kwa kazi kama vile kuchambua karatasi za utafiti pana au kuchakata hati ndefu.
- Modality ya Lugha Nyingi: Mifumo yote ya Llama 4 inaonyesha ustadi wa lugha nyingi, ikisaidia lugha anuwai za usindikaji wa maandishi: Kiarabu, Kiingereza, Kifaransa, Kijerumani, Kihindi, Kiindonesia, Kiitaliano, Kireno, Kihispania, Kitagalogi, Kithai, na Kivietinamu. Walakini, uelewaji wa picha kwa sasa ni mdogo kwa Kiingereza.
- Uzalishaji wa Maandishi: Mifumo ya Llama 4 inafanikiwa katika kutoa maandishi thabiti na yanayofaa muktadha, pamoja na juhudi za uandishi wa ubunifu. Mfumo unaweza kuzoea mitindo anuwai ya uandishi na kutoa maandishi ya ubora wa binadamu.
- Hoja ya Juu: Mifumo hii ina uwezo wa kutoa hoja kupitia shida ngumu za kisayansi na hisabati. Wanaweza kufafanua mantiki ngumu na kufikia hitimisho sahihi.
- Uzalishaji wa Msimbo: Llama 4 ina uwezo wa kuelewa na kutoa msimbo wa programu, kusaidia watengenezaji katika kurahisisha utiririshaji wao wa kazi. Mfumo unaweza kutoa vipande vya msimbo, kukamilisha kazi, na hata kukuza programu nzima.
- Utendaji wa Mfumo wa Msingi: Kama mfumo wazi, Llama 4 hutumika kama msingi wa ukuzaji wa mifumo inayotokana. Watafiti na watengenezaji wanaweza kurekebisha Llama 4 kwa kazi maalum, wakitumia uwezo wake uliopo kujenga programu maalum.
Mbinu za Mafunzo ya Meta Llama 4
Meta iliajiri safu ya mbinu za hali ya juu kufunza LLMs za familia ya Llama ya kizazi cha nne, ikilenga kuongeza usahihi na utendaji ikilinganishwa na matoleo ya mapema. Mbinu hizi zilijumuisha:
- Data ya Mafunzo: Msingi wa LLM yoyote ni data yake ya mafunzo, na Meta ilitambua kuwa data zaidi inatafsiri kwa utendaji bora. Kwa hivyo, Llama 4 ilifunzwa kwa zaidi ya tokeni trilioni 30, ikiongeza maradufu kiwango cha data iliyotumika kufunza Llama 3.
- Multimodality ya Fusion ya Awali: Mfululizo wa Llama 4 ulipitisha mbinu ya “fusion ya mapema”, ambayo inaunganisha tokeni za maandishi na maono katika mfumo uliounganishwa. Mbinu hii, kulingana na Meta, inakuza uelewa wa asili zaidi kati ya habari ya kuona na maandishi, ikiondoa hitaji la encoder na decoder tofauti.
- Uboreshaji wa Hyperparameter: Mbinu hii inajumuisha kurekebisha vigezo muhimu vya mfumo, kama vile viwango vya kujifunza kwa kila safu, ili kufikia matokeo ya mafunzo ya kuaminika zaidi na thabiti. Kwa kuboresha vigezo hivi, Meta iliweza kuboresha utulivu wa jumla na utendaji wa Llama 4.
- Usanifu wa iRoPE: Tabaka za usikivu zilizounganishwa bila usanifu wa upachikaji wa nafasi, au usanifu wa iRoPE, huongeza ushughulikiaji wa mfuatano mrefu wakati wa mafunzo na kuwezesha dirisha la muktadha la tokeni milioni 10 katika Llama 4 Scout. Usanifu huu unaruhusu mfumo kuhifadhi habari kutoka sehemu za mbali za mfuatano wa ingizo, na kuwezesha kuchakata hati ndefu na ngumu zaidi.
- MetaCLIP Vision Encoder: Encoder mpya ya maono ya Meta hutafsiri picha kuwa uwakilishi wa tokeni, na kusababisha uelewaji bora wa multimodal. Encoder hii inawezesha Llama 4 kuchakata na kufasiri habari ya kuona kwa ufanisi.
- Mafunzo ya Usalama ya GOAT: Meta ilitekeleza Generative Offensive Agent Tester (GOAT) katika mafunzo yote ili kubaini udhaifu wa LLM na kuboresha usalama wa mfumo. Mbinu hii husaidia kupunguza hatari ya mfumo kutoa maudhui hatari au ya ubaguzi.
Mageuzi ya Mifumo ya Llama
Kufuatia uzinduzi wa msingi wa ChatGPT mnamo Novemba 2022, kampuni katika tasnia yote zilishindana kuanzisha msimamo katika soko la LLM. Meta alikuwa miongoni mwa wahojiwa wa mapema, akianzisha mifumo yake ya awali ya Llama mwanzoni mwa 2023, ingawa kwa ufikiaji mdogo. Kuanzia na kutolewa kwa Llama 2 katikati ya 2023, mifumo yote iliyofuata imefanywa kupatikana chini ya leseni wazi.
- Llama 1: Mfumo asili wa Llama, uliozinduliwa mnamo Februari 2023 na ufikiaji mdogo.
- Llama 2: Iliyotolewa mnamo Julai 2023 kama mfumo wa kwanza wa Llama na leseni wazi, Llama 2 ilitoa ufikiaji wa bure na matumizi. Marudio haya yalijumuisha matoleo ya kigezo cha 7B, 13B, na 70B, yanayokidhi mahitaji anuwai ya hesabu.
- Llama 3: Mifumo ya Llama 3 ilianza kuonekana mnamo Aprili 2024, awali na matoleo ya kigezo cha 8B na 70B.
- Llama 3.1: Iliyozinduliwa mnamo Julai 2024, Llama 3.1 iliongeza mfumo wa kigezo cha 405B, ikisukuma mipaka ya uwezo wa LLM.
- Llama 3.2: Mfumo huu, LLM ya kwanza kabisa ya multimodal ya Meta, ilitolewa mnamo Oktoba 2024, ikiashiria hatua muhimu katika mageuzi ya familia ya Llama.
- Llama 3.3: Meta ilidai katika toleo lake la Desemba 2024 kwamba lahaja ya 70B ya Llama 3.3 ilitoa utendaji sawa na lahaja ya 405B ya 3.1, huku ikihitaji rasilimali chache za hesabu, ikionyesha juhudi endelevu za uboreshaji.
Llama 4 Ikilinganishwa na Mifumo Mengine
Mandhari ya AI ya uzalishaji inazidi kuwa ya ushindani, ikiwa na wachezaji maarufu kama GPT-4o ya OpenAI, Google Gemini 2.0, na miradi mbali mbali ya chanzo huria pamoja na DeepSeek.
Utendaji wa Llama 4 unaweza kukadiriwa kwa kutumia vigezo kadhaa, pamoja na:
- MMMU (Massive Multi-discipline Multimodal Understanding): Hukagua uwezo wa hoja ya picha.
- LiveCodeBench: Inakagua ustadi wa kuweka msimbo.
- GPQA Diamond (Graduate-Level Google-Proof Q&A Diamond): Hupima hoja na ujuzi.
Alama za juu kwenye vigezo hivi zinaonyesha utendaji bora.
Llama 4 Maverick | Gemini 2.0 Flash | GPT-4o | |
---|---|---|---|
Hoja ya picha ya MMMU | 73.4 | 71.7 | 69.1 |
LiveCodeBench | 43.4 | 34.05 | 32.3 |
GPQA Diamond | 69.8 | 60.1 | 53.6 |
Vigezo hivi vinaangazia nguvu za Llama 4 Maverick katika hoja ya picha, kuweka msimbo, na ujuzi wa jumla, ikiweka kama mshindani hodari katika uwanja wa LLM.
Kupata Llama 4
Meta Llama 4 Maverick na Scout zinapatikana kwa urahisi kupitia chaneli mbali mbali:
- Llama.com: Pakua Scout na Maverick moja kwa moja kutoka kwa wavuti inayoendeshwa na Meta ya llama.com bila malipo.
- Meta.ai: Kiolesura cha wavuti cha Meta.ai kinatoa ufikiaji wa Llama 4 unaotegemea kivinjari, kuruhusu watumiaji kuingiliana na mfumo bila kuhitaji usakinishaji wowote wa ndani.
- Hugging Face: Llama 4 pia inapatikana katika https://huggingface.co/meta-llama, jukwaa maarufu la kushiriki na kugundua mifumo ya kujifunza mashine.
- Meta AI App: Llama 4 inawezesha msaidizi wa mtandaoni wa AI wa Meta, anayeweza kufikiwa kupitia sauti au maandishi kwenye majukwaa mbali mbali. Watumiaji wanaweza kutumia msaidizi kufanya kazi kama vile kufupisha maandishi, kutoa maudhui, na kujibu maswali.