Huduma ya Oracle Cloud Infrastructure (OCI) Generative AI imepata nyongeza ya kusisimua: Msururu wa modeli za Meta Llama 4, zikiwemo Scout na Maverick. Modeli hizi zimeunganisha usanifu wa kipekee wa Mchanganyiko wa Wataalamu (MoE), ambao umeboresha kwa kiasi kikubwa uwezo wa usindikaji na ufanisi. Zimeboreshwa mahsusi ili kuonyesha utendakazi bora katika nyanja nyingi kama vile uelewa wa aina nyingi, kazi za lugha nyingi, utengenezaji wa msimbo, na uanzishaji wa zana ambazo zinaweza kuendesha mifumo ya wakala wa hali ya juu.
Hivi sasa, modeli hizi zinapatikana katika matoleo rasmi (GA) katika maeneo yafuatayo:
- On-demand: ORD (Chicago)
- Nguzo ya AI ya Kujitolea: ORD (Chicago), GRU (Guarulhos), LHR (London), KIK (Kikuyu)
Mambo Muhimu ya Msururu wa Llama 4
Uwezo wa Aina Nyingi: Kuvunja Mipaka ya Aina za Data
Llama 4 Scout na Maverick si modeli za lugha tu, ni mabingwa wa kweli wa aina nyingi. Zina uwezo wa asili wa kuchakata na kuunganisha aina mbalimbali za data, ikiwa ni pamoja na maandishi na picha, hivyo kuwezesha matumizi ya AI tajiri na ya kina zaidi. Unaweza kufikiria mfumo wa AI unaoweza kuelewa maelezo ya maandishi na picha inayohusiana kwa wakati mmoja, ili kuelewa vyema muktadha na kufanya maamuzi bora. Uwezo huu wa aina nyingi unafungua uwezekano mpya kwa kazi kama vile utengenezaji wa manukuu ya picha na maswali na majibu ya kuona.
Usaidizi wa Lugha Nyingi: Mawasiliano Bila Mipaka
Kivutio kingine cha mfululizo wa Llama 4 ni uwezo wake thabiti wa usaidizi wa lugha nyingi. Miundo hii ilifunzwa seti ya data iliyo na lugha 200, na ilirekebishwa vizuri kwa lugha 12 kuu (Kiarabu, Kiingereza, Kifaransa, Kijerumani, Kihindi, Kiindonesia, Kiitaliano, Kireno, Kihispania, Kitagalogi, Thai na Kivietinamu). Hii inamaanisha kuwa wanaweza kuelewa na kutoa maandishi katika lugha nyingi, hivyo kufungua milango kwa matumizi ya kimataifa. Ikumbukwe kwamba utendaji wa uelewa wa picha kwa sasa unaauni Kiingereza pekee.
Uendelezaji Ufanisi: Alama Ndogo ya GPU
Kwa wasanidi programu, Llama 4 Scout iliundwa tangu mwanzo ili kufikia ufikivu mkubwa. Inaweza kufanya kazi kwa ufanisi kwenye alama ndogo ya GPU, ambayo inafanya kuwa chaguo bora kwa mazingira yenye rasilimali ndogo. Hii inamaanisha kuwa hata bila vifaa vya nguvu vya nguvu, wasanidi programu wanaweza kutumia nguvu za Llama 4 Scout ili kuharakisha uundaji na upelekaji wa programu za AI.
Miundo ya Chanzo Huria: Kuwezesha Jumuiya
Meta ilichagua msimamo wazi na ilitoa modeli hizi mbili chini ya Leseni ya Jumuiya ya Llama 4. Hii inamaanisha kuwa wasanidi programu wanaweza kuzirekebisha na kuziendesha kwa uhuru, mradi tu wanatii masharti mahususi ya leseni. Mfumo huu wazi unaweza kukuza uvumbuzi na ushirikiano katika jumuiya ya AI, kuruhusu watu wengi kushiriki katika uundaji na utumiaji wa teknolojia ya AI.
Tarehe ya Mwisho wa Maarifa
Ni muhimu kutambua kwamba tarehe ya mwisho ya maarifa kwa modeli za Llama 4 ni Agosti 2024. Hii inamaanisha kuwa haziwezi kutoa taarifa za hivi punde kuhusu matukio au taarifa ambayo imetokea baada ya tarehe hii.
Ujumbe Muhimu: Sera ya Matumizi Inayokubalika ya Llama inaweka vikwazo kwa matumizi yake ndani ya Umoja wa Ulaya (EU).
Llama 4 Scout: Bingwa Mwepesi
Usanifu: Ubunifu Mahiri wa Parameta
Llama 4 Scout inatumia usanifu mzuri, unaoamilisha vigezo bilioni 17 pekee kati ya jumla ya vigezo bilioni 109. Usanifu huu hutumia mchanganyiko wa wataalam 16, na hivyo kufikia usawa mzuri kati ya utendaji na ufanisi. Kwa kuamilisha sehemu tu ya vigezo, Scout inaweza kupunguza kwa kiasi kikubwa mahitaji ya kompyuta, na kuifanya iweze kufanya kazi katika mazingira yenye rasilimali ndogo.
Dirisha la Muktadha: Uwezo wa Kushughulikia Maandishi Marefu
Llama 4 Scout inaauni urefu wa muktadha wa hadi tokeni milioni 10 (zinahitaji GPU nyingi). Hata hivyo, katika toleo rasmi (GA), huduma ya OCI Generative AI itaunga mkono urefu wa muktadha wa tokeni 192k. Hata dirisha la muktadha la 192k linatosha kushughulikia maandishi marefu, kama vile sura za kitabu au ripoti za kina.
Upelekaji: Ndogo lakini yenye Nguvu
Moja ya malengo ya muundo wa Llama 4 Scout ni kufanya kazi kwa ufanisi kwenye alama ndogo ya GPU. Hii inafanya kuwa chaguo bora kwa matukio mbalimbali ya upelekaji, ikiwa ni pamoja na vifaa vya pembeni na mazingira ya wingu yenye rasilimali ndogo.
Utendaji: Inashinda Washindani
Llama 4 Scout imefanya vyema katika majaribio mengi ya kulinganisha, na kuishinda modeli kama vile Gemma 3 ya Google na Mistral 3.1. Hii inathibitisha uwezo bora wa Scout katika suala la utendaji, na kuifanya kuwa zana yenye nguvu kwa kazi mbalimbali za AI.
Llama 4 Maverick: Mzito
Usanifu: Ukubwa Mkubwa, Nguvu Kubwa
Ikilinganishwa na Scout, Llama 4 Maverick inatumia usanifu mkubwa zaidi. Pia inaamilisha vigezo bilioni 17, lakini inafanya hivyo ndani ya mfumo mkubwa zaidi wa vigezo bilioni 400, na hutumia wataalam 128. Ukubwa huu mkubwa unampa Maverick uwezo mkubwa zaidi, na kumruhusu kufanya vyema katika kazi ngumu zaidi za AI.
Dirisha la Muktadha: Kumbukumbu Ndani Sana
Llama 4 Maverick inaauni urefu wa muktadha wa hadi tokeni milioni 1. Katika toleo rasmi (GA), upelekaji wa OCI utaauni urefu wa muktadha wa tokeni 512k. Dirisha hili refu la muktadha linawezesha Maverick kushughulikia maandishi magumu sana, kama vile vitabu kamili au mkusanyiko wa hati nyingi.
Upelekaji: Inahitaji Nafasi Kubwa
Kwa sababu ya ukubwa wake mkubwa, Llama 4 Maverick inahitaji nafasi kubwa ya upelekaji kuliko Scout. Kwa wakati wa GA, upelekaji wa Maverick kwenye OCI unahitaji karibu nafasi mara mbili ya Scout.
Utendaji: Inashindana na Miundo ya Juu
Katika majukumu ya utengenezaji na usababu wa msimbo, Llama 4 Maverick inalingana na miundo ya juu kama vile GPT-4o ya OpenAI na DeepSeek-V3. Hii inathibitisha nafasi ya uongozi ya Maverick katika uwanja wa AI.
Kwa jumla, msururu wa Llama 4 unawakilisha maendeleo makubwa katika uundaji wa modeli za AI. Zimeboreshwa kwa kiasi kikubwa katika suala la utendaji, matumizi mengi, na ufikivu, na kutoa msaada thabiti kwa matukio mbalimbali ya matumizi.
Wateja wa OCI sasa wanaweza kutumia kwa urahisi modeli hizi zenye nguvu bila kuwa na wasiwasi kuhusu ugumu wa usimamizi wa miundombinu. Wanaweza kupata modeli hizi kupitia kiolesura cha gumzo, API, au vituo vya mwisho vya kujitolea, na hivyo kurahisisha uundaji na upelekaji wa programu za AI.
Kutolewa kwa modeli za Llama 4 kunaashiria enzi mpya kwa huduma ya OCI Generative AI. Kwa kutoa modeli hizi za hali ya juu, OCI inasaidia wateja kufungua uwezo kamili wa AI na kuendesha uvumbuzi katika tasnia zote.