మెటా యొక్క లామా, మొదట్లో LLaMA (లార్జ్ లాంగ్వేజ్ మోడల్ మెటా AI)గా పిలువబడేది, ఫిబ్రవరి 2023లో రంగప్రవేశం చేసింది. ఇది పెద్ద భాషా నమూనాల (LLMలు) పోటీ ప్రపంచంలోకి మెటా యొక్క ప్రవేశాన్ని సూచిస్తుంది. జూలై 2023లో లామా 2 విడుదల ఒక గేమ్-ఛేంజర్, ఎందుకంటే మెటా ఓపెన్ అనుమతించే లైసెన్స్ను స్వీకరించింది, ఇది విస్తృత వ్యాప్తికి మరియు విస్తృత ఆదరణకు దారితీసింది. నిరంతరంగా మెరుగుపరచడం మరియు బహుళ పునరావృత్తుల ద్వారా, లామా తన సామర్థ్యాలను స్థిరంగా పెంచుకుంది, OpenAI, Anthropic మరియు Google వంటి పరిశ్రమ దిగ్గజాల మధ్య తన స్థానాన్ని సుస్థిరం చేసుకుంది.
లామా కుటుంబం ఏప్రిల్ 5, 2025న లామా 4 మోడల్ కుటుంబం పరిచయంతో మరింత విస్తరించింది, దీనిని లామా 4 మంద అని కూడా పిలుస్తారు, ఇది బహుళ నమూనా LLMల యొక్క కొత్త శకానికి నాంది పలికింది.
మెటా లామా 4 అంటే ఏమిటి?
మెటా లామా 4 LLM సాంకేతికతలో ఒక ముఖ్యమైన ముందడుగును సూచిస్తుంది, ఇది వచన, చిత్రాలు మరియు వీడియో డేటాను ప్రాసెస్ చేయడానికి మరియు అర్థం చేసుకోవడానికి వీలు కల్పించే బహుళ నమూనా సామర్థ్యాలను కలిగి ఉంది. ఈ నాల్గవ తరం మోడల్ ప్రపంచవ్యాప్తంగా ఉన్న అనేక భాషలకు మద్దతు ఇవ్వడం ద్వారా భాషా అవరోధాలను అధిగమిస్తుంది.
లామా 4 నమూనాలలో ఒక ముఖ్యమైన ఆవిష్కరణ ఏమిటంటే, నిపుణుల సమ్మేళనం నిర్మాణాన్ని స్వీకరించడం, లామా కుటుంబానికి ఇది మొదటిది. ఈ నిర్మాణం ప్రతి ఇన్పుట్ టోకెన్ కోసం మొత్తం పారామితుల ఉపసమితిని మాత్రమే డైనమిక్గా సక్రియం చేస్తుంది, తద్వారా శక్తి మరియు సామర్థ్యం మధ్య సమతుల్యతను సాధిస్తుంది.
లామా 4 కమ్యూనిటీ లైసెన్స్ అధికారికంగా ఓపెన్ సోర్స్ ఇనిషియేటివ్-ఆమోదిత లైసెన్స్గా గుర్తించబడనప్పటికీ, మెటా దాని లామా 4 మోడళ్లను ఓపెన్ సోర్స్గా వర్ణిస్తుంది. లైసెన్స్ కొన్ని పరిమితులకు లోబడి లామా 4 మోడళ్లకు ఉచిత వినియోగం మరియు మార్పు హక్కులను మంజూరు చేస్తుంది. ఏప్రిల్ 2025 నాటికి, పరిమితి నెలవారీ 700 మిలియన్ల వినియోగదారులకు పరిమితం చేయబడింది, దానికంటే ఎక్కువ ఉంటే వాణిజ్య లైసెన్స్ అవసరం.
లామా 4 లైనప్లో మూడు ప్రాథమిక వెర్షన్లు ఉన్నాయి: స్కౌట్, మావెరిక్ మరియు బెహెమోత్. స్కౌట్ మరియు మావెరిక్ ఏకకాలంలో ప్రారంభించబడ్డాయి, అయితే బెహెమోత్ అభివృద్ధిలో ఉంది. ఈ నమూనాలు వాటి లక్షణాలలో గణనీయంగా మారుతూ ఉంటాయి:
- లామా 4 స్కౌట్: 17 బిలియన్ క్రియాశీల పారామితులు, 16 మంది నిపుణులు, 109 బిలియన్ల మొత్తం పారామితులు, 10 మిలియన్ల టోకెన్ కాంటెక్స్ట్ విండో మరియు ఆగస్టు 2024 యొక్క నాలెడ్జ్ కటాఫ్ను కలిగి ఉంది.
- లామా 4 మావెరిక్: 17 బిలియన్ క్రియాశీల పారామితులను కూడా కలిగి ఉంది, కానీ 128 మంది నిపుణులు, 400 బిలియన్ల మొత్తం పారామితులు, 1 మిలియన్ టోకెన్ కాంటెక్స్ట్ విండో మరియు స్కౌట్ మాదిరిగానే నాలెడ్జ్ కటాఫ్ను కలిగి ఉంది.
- లామా 4 బెహెమోత్: మూడింటిలో అత్యంత శక్తివంతమైనది, 288 బిలియన్ క్రియాశీల పారామితులు, 16 మంది నిపుణులు, 2 ట్రిలియన్ మొత్తం పారామితులు మరియు పేర్కొనబడని కాంటెక్స్ట్ విండో మరియు నాలెడ్జ్ కటాఫ్తో ఉంటుంది.
మెటా లామా 4 యొక్క సామర్థ్యాలు
మెటా లామా 4 నమూనాలు వివిధ రకాల అనువర్తనాలను అన్లాక్ చేస్తాయి, వీటిలో:
- స్థానిక బహుళ నమూనా: వచనం, చిత్రాలు మరియు వీడియోను ఏకకాలంలో అర్థం చేసుకునే సామర్థ్యం. ఇది విభిన్న సమాచార మూలాల నుండి సందర్భం మరియు అర్థాన్ని పొందడానికి మోడల్ను అనుమతిస్తుంది.
- కంటెంట్ సారాంశం: లామా 4 నమూనాలు వివిధ కంటెంట్ రకాల నుండి సమాచారాన్ని సమర్థవంతంగా సంగ్రహించగలవు, ఇది బహుళ నమూనాల అవగాహనలో కీలకమైన అంశం. ఉదాహరణకు, మోడల్ ఒక వీడియోను విశ్లేషించగలదు, కీలకమైన సన్నివేశాలను సంగ్రహించగలదు మరియు కంటెంట్ యొక్క సంక్షిప్త సారాంశాన్ని రూపొందించగలదు.
- సుదీర్ఘ-సందర్భ ప్రాసెసింగ్: లామా 4 స్కౌట్ ప్రత్యేకంగా భారీ మొత్తంలో సమాచారాన్ని ప్రాసెస్ చేయడానికి రూపొందించబడింది, దీని విస్తారమైన 10 మిలియన్ల టోకెన్ కాంటెక్స్ట్ విండో ద్వారా ఇది సాధ్యమవుతుంది. విస్తృతమైన పరిశోధన పత్రాలను విశ్లేషించడం లేదా సుదీర్ఘ పత్రాలను ప్రాసెస్ చేయడం వంటి పనులకు ఈ సామర్థ్యం అమూల్యమైనది.
- బహుభాషా నమూనా: అన్ని లామా 4 నమూనాలు బహుభాషా నైపుణ్యాన్ని ప్రదర్శిస్తాయి, వచన ప్రాసెసింగ్ కోసం అనేక భాషలకు మద్దతు ఇస్తాయి: అరబిక్, ఇంగ్లీష్, ఫ్రెంచ్, జర్మన్, హిందీ, ఇండోనేషియన్, ఇటాలియన్, పోర్చుగీస్, స్పానిష్, టాగలాగ్, థాయ్ మరియు వియత్నామీస్. అయితే, చిత్ర అవగాహన ప్రస్తుతం ఆంగ్లానికి మాత్రమే పరిమితం చేయబడింది.
- వచన ఉత్పత్తి: లామా 4 నమూనాలు పొందికైన మరియు సందర్భోచితంగా సంబంధిత వచనాన్ని ఉత్పత్తి చేయడంలో, సృజనాత్మక రచన ప్రయత్నాలతో సహా రాణిస్తాయి. మోడల్ వివిధ రచన శైలులకు అనుగుణంగా ఉంటుంది మరియు మానవ-నాణ్యత గల వచనాన్ని ఉత్పత్తి చేస్తుంది.
- అధునాతన తార్కికం: ఈ నమూనాలు సంక్లిష్టమైన శాస్త్రీయ మరియు గణిత సమస్యల ద్వారా తర్కించే సామర్థ్యాన్ని కలిగి ఉంటాయి. అవి సంక్లిష్టమైన తర్కాన్ని విడదీయగలవు మరియు ఖచ్చితమైన తీర్మానాలను చేరుకోగలవు.
- కోడ్ ఉత్పత్తి: లామా 4 అప్లికేషన్ కోడ్ను గ్రహించగలదు మరియు ఉత్పత్తి చేయగలదు, ఇది డెవలపర్లకు వారి పని విధానాలను క్రమబద్ధీకరించడంలో సహాయపడుతుంది. మోడల్ కోడ్ స్నిప్పెట్లను ఉత్పత్తి చేయగలదు, ఫంక్షన్లను పూర్తి చేయగలదు మరియు మొత్తం అప్లికేషన్లను కూడా అభివృద్ధి చేయగలదు.
- బేస్ మోడల్ కార్యాచరణ: ఓపెన్ మోడల్గా, లామా 4 ఉత్పన్న నమూనాల అభివృద్ధికి ఒక పునాది అంశంగా పనిచేస్తుంది. పరిశోధకులు మరియు డెవలపర్లు నిర్దిష్ట పనుల కోసం లామా 4ని చక్కగా ట్యూన్ చేయవచ్చు, ప్రత్యేక అనువర్తనాలను రూపొందించడానికి దాని ప్రస్తుత సామర్థ్యాలను ఉపయోగించుకోవచ్చు.
మెటా లామా 4 యొక్క శిక్షణ పద్ధతి
మునుపటి వెర్షన్లతో పోలిస్తే ఖచ్చితత్వం మరియు పనితీరును మెరుగుపరచడం లక్ష్యంగా, మెటా తన నాల్గవ తరం లామా కుటుంబ LLMలకు శిక్షణ ఇవ్వడానికి అధునాతన పద్ధతుల సమితిని ఉపయోగించింది. ఈ పద్ధతుల్లో ఇవి ఉన్నాయి:
- శిక్షణ డేటా: ఏదైనా LLMకి మూలస్తంభం దాని శిక్షణ డేటా మరియు ఎక్కువ డేటా మెరుగైన పనితీరుకు దారితీస్తుందని మెటా గుర్తించింది. ఈ మేరకు, లామా 4 30 ట్రిలియన్ టోకెన్ల కంటే ఎక్కువ శిక్షణ పొందింది, ఇది లామా 3కి శిక్షణ ఇవ్వడానికి ఉపయోగించిన డేటా మొత్తాన్ని రెట్టింపు చేసింది.
- ప్రారంభ ఫ్యూజన్ బహుళ నమూనా: లామా 4 సిరీస్ “ప్రారంభ ఫ్యూజన్” విధానాన్ని స్వీకరించింది, ఇది వచన మరియు దృష్టి టోకెన్లను ఏకీకృత నమూనాలో అనుసంధానిస్తుంది. మెటా ప్రకారం, ఈ విధానం దృశ్య మరియు వచన సమాచారం మధ్య మరింత సహజమైన అవగాహనను ప్రోత్సహిస్తుంది, ప్రత్యేక ఎన్కోడర్లు మరియు డీకోడర్ల అవసరాన్ని తొలగిస్తుంది.
- హైపర్ పారామీటర్ ఆప్టిమైజేషన్: ఈ పద్ధతి మరింత నమ్మదగిన మరియు స్థిరమైన శిక్షణ ఫలితాలను సాధించడానికి ప్రతి-లేయర్ లెర్నింగ్ రేట్లు వంటి క్లిష్టమైన మోడల్ హైపర్ పారామీటర్లను చక్కగా ట్యూన్ చేయడాన్ని కలిగి ఉంటుంది. ఈ పారామీటర్లను ఆప్టిమైజ్ చేయడం ద్వారా, మెటా లామా 4 యొక్క మొత్తం స్థిరత్వం మరియు పనితీరును మెరుగుపరచగలిగింది.
- iRoPE ఆర్కిటెక్చర్: స్థాన పొందుపరచడం లేని ఇంటర్లీవ్డ్ అటెన్షన్ లేయర్ల ఆర్కిటెక్చర్, లేదా iRoPE ఆర్కిటెక్చర్ శిక్షణ సమయంలో సుదీర్ఘ సీక్వెన్స్ల నిర్వహణను మెరుగుపరుస్తుంది మరియు లామా 4 స్కౌట్లో 10 మిలియన్ల టోకెన్ కాంటెక్స్ట్ విండోకు సహాయపడుతుంది. ఈ నిర్మాణం మోడల్ను ఇన్పుట్ సీక్వెన్స్ యొక్క దూర ప్రాంతాల నుండి సమాచారాన్ని నిలుపుకోవడానికి అనుమతిస్తుంది, ఇది పొడవైన మరియు మరింత సంక్లిష్టమైన పత్రాలను ప్రాసెస్ చేయడానికి వీలు కల్పిస్తుంది.
- MetaCLIP విజన్ ఎన్కోడర్: కొత్త మెటా విజన్ ఎన్కోడర్ చిత్రాలను టోకెన్ ప్రాతినిధ్యాలుగా అనువదిస్తుంది, ఇది మెరుగైన బహుళ నమూనాల అవగాహనకు దారితీస్తుంది. ఈ ఎన్కోడర్ లామా 4ని దృశ్య సమాచారాన్ని సమర్థవంతంగా ప్రాసెస్ చేయడానికి మరియు అర్థం చేసుకోవడానికి వీలు కల్పిస్తుంది.
- GOAT సేఫ్టీ ట్రైనింగ్: LLM దుర్బలత్వాలను గుర్తించడానికి మరియు మోడల్ భద్రతను మెరుగుపరచడానికి శిక్షణ అంతటా మెటా జనరేటివ్ అఫెన్సివ్ ఏజెంట్ టెస్టర్ (GOAT)ని అమలు చేసింది. ఈ పద్ధతి మోడల్ హానికరమైన లేదా పక్షపాత కంటెంట్ను ఉత్పత్తి చేసే ప్రమాదాన్ని తగ్గించడంలో సహాయపడుతుంది.
లామా మోడళ్ల పరిణామం
నవంబర్ 2022లో ChatGPT యొక్క సంచలనాత్మక ప్రారంభం తరువాత, పరిశ్రమలోని కంపెనీలు LLM మార్కెట్లో స్థానం సంపాదించడానికి పోటీపడ్డాయి. మెటా ప్రారంభ ప్రతిస్పందనదారులలో ఒకటి, ప్రారంభ 2023లో దాని ప్రారంభ లామా నమూనాలను పరిమిత ప్రాప్యతతో పరిచయం చేసింది. మధ్య 2023లో లామా 2 విడుదల నుండి ప్రారంభించి, తరువాతి మోడళ్లన్నీ ఓపెన్ లైసెన్స్ల క్రింద అందుబాటులోకి వచ్చాయి.
- లామా 1: అసలైన లామా మోడల్, ఫిబ్రవరి 2023లో పరిమిత ప్రాప్యతతో ప్రారంభించబడింది.
- లామా 2: జూలై 2023లో ఓపెన్ లైసెన్స్తో మొదటి లామా మోడల్గా విడుదల చేయబడింది, లామా 2 ఉచిత ప్రాప్యత మరియు వినియోగాన్ని అందించింది. ఈ పునరావృత్తిలో వివిధ గణన అవసరాలకు అనుగుణంగా 7B, 13B మరియు 70B పారామీటర్ వెర్షన్లు ఉన్నాయి.
- లామా 3: లామా 3 మోడల్లు ఏప్రిల్ 2024లో ప్రారంభమయ్యాయి, ప్రారంభంలో 8B మరియు 70B పారామీటర్ వెర్షన్లతో.
- లామా 3.1: జూలై 2024లో ప్రారంభించబడింది, లామా 3.1 LLM సామర్థ్యాల సరిహద్దులను నెట్టడం ద్వారా 405B పారామీటర్ మోడల్ను జోడించింది.
- లామా 3.2: ఈ మోడల్, మెటా యొక్క మొదటి పూర్తిగా బహుళ నమూనా LLM, అక్టోబర్ 2024లో విడుదలైంది, ఇది లామా కుటుంబం యొక్క పరిణామంలో ఒక ముఖ్యమైన మైలురాయిని సూచిస్తుంది.
- లామా 3.3: డిసెంబర్ 2024 విడుదల సందర్భంగా మెటా లామా 3.3 యొక్క 70B వేరియంట్ 3.1 యొక్క 405B వేరియంట్ మాదిరిగానే పనితీరును అందించిందని పేర్కొంది, అయితే తక్కువ గణన వనరులు అవసరమవుతాయి, ఇది నిరంతర ఆప్టిమైజేషన్ ప్రయత్నాలను ప్రదర్శిస్తుంది.
ఇతర మోడళ్లతో పోలిస్తే లామా 4
జనరేటివ్ AI యొక్క ల్యాండ్స్కేప్ పెరుగుతున్న పోటీగా మారుతోంది, ఇందులో OpenAI యొక్క GPT-4o, Google Gemini 2.0 మరియు DeepSeekతో సహా వివిధ ఓపెన్-సోర్స్ ప్రాజెక్ట్లు వంటి ప్రముఖ ఆటగాళ్లు ఉన్నారు.
లామా 4 పనితీరును అనేక బెంచ్మార్క్లను ఉపయోగించి అంచనా వేయవచ్చు, వీటిలో:
- MMMU (మాసివ్ మల్టీ-డిసిప్లిన్ మల్టీమోడల్ అండర్స్టాండింగ్): చిత్ర తార్కిక సామర్థ్యాలను అంచనా వేస్తుంది.
- LiveCodeBench: కోడింగ్ నైపుణ్యాన్ని అంచనా వేస్తుంది.
- GPQA డైమండ్ (గ్రాడ్యుయేట్-లెవెల్ గూగుల్-ప్రూఫ్ Q&A డైమండ్): తార్కికం మరియు జ్ఞానాన్ని కొలుస్తుంది.
ఈ బెంచ్మార్క్లపై అధిక స్కోర్లు మెరుగైన పనితీరును సూచిస్తాయి.
లామా 4 మావెరిక్ | జెమిని 2.0 ఫ్లాష్ | GPT-4o | |
---|---|---|---|
MMMU చిత్రం తార్కికం | 73.4 | 71.7 | 69.1 |
LiveCodeBench | 43.4 | 34.05 | 32.3 |
GPQA డైమండ్ | 69.8 | 60.1 | 53.6 |
ఈ బెంచ్మార్క్లు లామా 4 మావెరిక్ యొక్క చిత్ర తార్కికం, కోడింగ్ మరియు సాధారణ జ్ఞానంలోని బలాన్ని హైలైట్ చేస్తాయి, ఇది LLM రంగంలో బలమైన పోటీదారుగా నిలిచింది.
లామా 4ని యాక్సెస్ చేయడం
మెటా లామా 4 మావెరిక్ మరియు స్కౌట్ వివిధ మార్గాల ద్వారా సులభంగా అందుబాటులో ఉన్నాయి:
- Llama.com: మెటా ద్వారా నిర్వహించబడే llama.com వెబ్సైట్ నుండి నేరుగా స్కౌట్ మరియు మావెరిక్లను ఉచితంగా డౌన్లోడ్ చేయండి.
- Meta.ai: Meta.ai వెబ్ ఇంటర్ఫేస్ లామా 4కి బ్రౌజర్ ఆధారిత ప్రాప్యతను అందిస్తుంది, వినియోగదారులు ఏదైనా స్థానిక ఇన్స్టాలేషన్ అవసరం లేకుండా మోడల్తో పరస్పర చర్య చేయడానికి అనుమతిస్తుంది.
- Hugging Face: లామా 4 https://huggingface.co/meta-llama వద్ద కూడా అందుబాటులో ఉంది, ఇది యంత్ర అభ్యాస నమూనాలను పంచుకోవడానికి మరియు కనుగొనడానికి ఒక ప్రసిద్ధ వేదిక.
- Meta AI యాప్: లామా 4 మెటా యొక్క AI వర్చువల్ అసిస్టెంట్కు శక్తినిస్తుంది, ఇది వివిధ ప్లాట్ఫారమ్లలో వాయిస్ లేదా టెక్స్ట్ ద్వారా అందుబాటులో ఉంటుంది. వచనాన్ని సంగ్రహించడం, కంటెంట్ను ఉత్పత్తి చేయడం మరియు ప్రశ్నలకు సమాధానం ఇవ్వడం వంటి పనులను చేయడానికి వినియోగదారులు సహాయకుడిని ఉపయోగించవచ్చు.