மெட்டாவின் லாமா, ஆரம்பத்தில் LLaMA (Large Language Model Meta AI) என்று அறியப்பட்டது, பிப்ரவரி 2023 இல் அறிமுகமானது, இது பெரிய மொழி மாதிரிகள் (LLMs) உலகில் மெட்டாவின் நுழைவைக் குறித்தது. ஜூலை 2023 இல் லாமா 2 இன் வெளியீடு ஒரு திருப்புமுனையாக இருந்தது, ஏனெனில் மெட்டா ஒரு திறந்த அனுமதி உரிமத்தை ஏற்றுக்கொண்டது, அணுகலை ஜனநாயகப்படுத்துகிறது மற்றும் பரவலான தத்தெடுப்பை ஊக்குவிக்கிறது. தொடர்ச்சியான செம்மைப்படுத்தல் மற்றும் பல மறு செய்கைகள் மூலம், லாமா அதன் திறன்களை சீராக மேம்படுத்தி, OpenAI, Anthropic மற்றும் Google போன்ற தொழில்துறை ஜாம்பவான்களிடையே தனது நிலையை உறுதிப்படுத்தியுள்ளது.
லாமா குடும்பம் ஏப்ரல் 5, 2025 அன்று மேலும் விரிவடைந்தது, லாமா 4 மாடல் குடும்பத்தின் அறிமுகத்துடன், லாமா 4 மந்தை என்றும் அழைக்கப்படுகிறது, இது மல்டிமாடல் LLMகளின் ஒரு புதிய சகாப்தத்தைத் தூண்டுகிறது.
மெட்டா லாமா 4 என்றால் என்ன?
மெட்டா லாமா 4 LLM தொழில்நுட்பத்தில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தை பிரதிபலிக்கிறது, இது உரை, படங்கள் மற்றும் வீடியோ தரவை செயலாக்க மற்றும் விளக்க உதவும் மல்டிமாடல் திறன்களைக் கொண்டுள்ளது. இந்த நான்காவது தலைமுறை மாதிரி உலகின் பல மொழிகளை ஆதரிப்பதன் மூலம் மொழி தடைகளை மீறுகிறது.
லாமா 4 மாதிரிகளில் ஒரு முக்கிய கண்டுபிடிப்பு, நிபுணர்களின் கலவை கட்டமைப்பை ஏற்றுக்கொள்வது, லாமா குடும்பத்திற்கு இதுவே முதல் முறையாகும். இந்த கட்டமைப்பு ஒவ்வொரு உள்ளீட்டு டோக்கனுக்கும் மொத்த அளவுருக்களின் ஒரு பகுதியை மட்டுமே இயக்கமாக செயல்படுத்துகிறது, சக்திக்கும் செயல்திறனுக்கும் இடையே ஒரு இணக்கமான சமநிலையை அடைகிறது.
லாமா 4 சமூக உரிமம் அதிகாரப்பூர்வமாக Open Source Initiative-அங்கீகரிக்கப்பட்ட உரிமமாக அங்கீகரிக்கப்படவில்லை என்றாலும், மெட்டா அதன் லாமா 4 மாதிரிகளை திறந்த மூலமாக வகைப்படுத்துகிறது. இந்த உரிமம் சில வரம்புகளுக்கு உட்பட்டு, லாமா 4 மாதிரிகளுக்கு இலவச பயன்பாடு மற்றும் மாற்றும் உரிமைகளை வழங்குகிறது. ஏப்ரல் 2025 நிலவரப்படி, வரம்பு மாதத்திற்கு 700 மில்லியன் பயனர்களுக்கு மேல் என நிர்ணயிக்கப்பட்டுள்ளது, அதற்கு அப்பால் வணிக உரிமம் தேவைப்படுகிறது.
லாமா 4 வரிசையில் மூன்று முதன்மை பதிப்புகள் உள்ளன: ஸ்கவுட் (Scout), மேவரிக் (Maverick) மற்றும் பெஹிமோத் (Behemoth). ஸ்கவுட் மற்றும் மேவரிக் ஆகியவை ஒரே நேரத்தில் தொடங்கப்பட்டன, அதே நேரத்தில் பெஹிமோத் இன்னும் வளர்ச்சியில் உள்ளது. இந்த மாதிரிகள் அவற்றின் விவரக்குறிப்புகளில் கணிசமாக வேறுபடுகின்றன:
- லாமா 4 ஸ்கவுட்: 17 பில்லியன் செயலில் உள்ள அளவுருக்கள், 16 நிபுணர்கள், 109 பில்லியன் மொத்த அளவுருக்கள், 10 மில்லியன் டோக்கன் சூழல் சாளரம் மற்றும் ஆகஸ்ட் 2024 அறிவுக் கட்ஆஃப் ஆகியவற்றைக் கொண்டுள்ளது.
- லாமா 4 மேவரிக்: மேலும் 17 பில்லியன் செயலில் உள்ள அளவுருக்களைக் கொண்டுள்ளது, ஆனால் 128 நிபுணர்கள், 400 பில்லியன் மொத்த அளவுருக்கள், 1 மில்லியன் டோக்கன் சூழல் சாளரம் மற்றும் ஸ்கவுட்டைப் போன்ற அதே அறிவுக் கட்ஆஃப் ஆகியவற்றைக் கொண்டுள்ளது.
- லாமா 4 பெஹிமோத்: மூன்றில் மிகவும் சக்தி வாய்ந்தது, 288 பில்லியன் செயலில் உள்ள அளவுருக்கள், 16 நிபுணர்கள், 2 டிரில்லியன் மொத்த அளவுருக்கள் மற்றும் குறிப்பிடப்படாத சூழல் சாளரம் மற்றும் அறிவுக் கட்ஆஃப் ஆகியவற்றைக் கொண்டுள்ளது.
மெட்டா லாமா 4 இன் திறன்கள்
மெட்டா லாமா 4 மாதிரிகள் பல்வேறு வகையான பயன்பாடுகளைத் திறக்கின்றன, அவை பின்வருமாறு:
- இயற்கை மல்டிமாடல்: உரை, படங்கள் மற்றும் வீடியோவை ஒரே நேரத்தில் புரிந்து கொள்ளும் திறன். இது மாதிரிக்கு பல்வேறு தகவல்களிலிருந்து சூழலையும் அர்த்தத்தையும் பெற அனுமதிக்கிறது.
- உள்ளடக்கச் சுருக்கம்: லாமா 4 மாதிரிகள் பல்வேறு உள்ளடக்க வகைகளிலிருந்து தகவல்களை திறம்பட சுருக்க முடியும், இது மல்டிமாடல் புரிதலின் ஒரு முக்கிய அம்சமாகும். உதாரணமாக, மாதிரி ஒரு வீடியோவை பகுப்பாய்வு செய்யலாம், முக்கிய காட்சிகளை பிரித்தெடுக்கலாம் மற்றும் உள்ளடக்கத்தின் சுருக்கமான சுருக்கத்தை உருவாக்கலாம்.
- நீண்ட சூழல் செயலாக்கம்: லாமா 4 ஸ்கவுட் குறிப்பாக கணிசமான அளவிலான தகவல்களை செயலாக்க வடிவமைக்கப்பட்டுள்ளது, இது அதன் விரிவான 10 மில்லியன் டோக்கன் சூழல் சாளரத்தால் எளிதாக்கப்படுகிறது. விரிவான ஆராய்ச்சி கட்டுரைகளை பகுப்பாய்வு செய்வது அல்லது நீண்ட ஆவணங்களை செயலாக்குவது போன்ற பணிகளுக்கு இந்த திறன் விலைமதிப்பற்றது.
- பன்மொழி முறைமை: அனைத்து லாமா 4 மாதிரிகளும் பன்மொழி திறனைக் காட்டுகின்றன, உரை செயலாக்கத்திற்கான பரந்த அளவிலான மொழிகளை ஆதரிக்கின்றன: அரபு, ஆங்கிலம், பிரஞ்சு, ஜெர்மன், இந்தி, இந்தோனேசியன், இத்தாலியன், போர்த்துகீசியம், ஸ்பானிஷ், தகலாகு, தாய் மற்றும் வியட்னாமீஸ். இருப்பினும், படத்தைப் புரிந்துகொள்வது தற்போது ஆங்கிலத்திற்கு மட்டுமே மட்டுப்படுத்தப்பட்டுள்ளது.
- உரை உருவாக்கம்: லாமா 4 மாதிரிகள் ஒத்திசைவான மற்றும் சூழலுக்கு ஏற்ற உரையை உருவாக்குவதில் சிறந்தவை, இதில் ஆக்கப்பூர்வமான எழுத்து முயற்சிகளும் அடங்கும். மாதிரி பல்வேறு எழுத்து நடைகளுக்கு ஏற்றவாறு மனித தரமான உரையை உருவாக்க முடியும்.
- மேம்பட்ட பகுத்தறிவு: இந்த மாதிரிகள் சிக்கலான அறிவியல் மற்றும் கணித சிக்கல்களின் மூலம் பகுத்தறிவு செய்யும் திறனைக் கொண்டுள்ளன. அவை சிக்கலான தர்க்கத்தை விளக்க முடியும் மற்றும் சரியான முடிவுகளை எட்ட முடியும்.
- குறியீடு உருவாக்கம்: லாமா 4 பயன்பாட்டு குறியீட்டைப் புரிந்துகொள்ளவும் உருவாக்கவும் முடியும், டெவலப்பர்கள் தங்கள் பணிப்பாய்வுகளை நெறிப்படுத்த உதவுகிறது. மாதிரி குறியீடு துணுக்குகளை உருவாக்கலாம், செயல்பாடுகளை முடிக்கலாம் மற்றும் முழு பயன்பாடுகளையும் உருவாக்கலாம்.
- அடிப்படை மாதிரி செயல்பாடு: ஒரு திறந்த மாதிரியாக, லாமா 4 டெரிவேடிவ் மாதிரிகளின் வளர்ச்சிக்கு ஒரு அடிப்படை அங்கமாக செயல்படுகிறது. ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்கள் குறிப்பிட்ட பணிகளுக்காக லாமா 4 ஐ நன்றாக மாற்றலாம், அதன் இருக்கும் திறன்களை சிறப்பு பயன்பாடுகளை உருவாக்க பயன்படுத்தலாம்.
மெட்டா லாமா 4 இன் பயிற்சி முறை
மெட்டா தனது நான்காவது தலைமுறை லாமா குடும்ப LLMகளுக்கு பயிற்சி அளிக்க மேம்பட்ட நுட்பங்களின் தொகுப்பைப் பயன்படுத்தியது, முந்தைய பதிப்புகளைக் காட்டிலும் துல்லியம் மற்றும் செயல்திறனை மேம்படுத்துவதை நோக்கமாகக் கொண்டது. இந்த நுட்பங்களில் பின்வருவன அடங்கும்:
- பயிற்சி தரவு: எந்தவொரு LLMக்கும் பயிற்சி தரவு மிகவும் முக்கியமானது, மேலும் அதிக தரவு சிறந்த செயல்திறனை அளிக்கிறது என்பதை மெட்டா உணர்ந்தது. இந்த நோக்கத்திற்காக, லாமா 4 30 டிரில்லியனுக்கும் அதிகமான டோக்கன்களில் பயிற்சி அளிக்கப்பட்டது, இது லாமா 3 க்கு பயிற்சி அளிக்கப் பயன்படுத்தப்பட்ட தரவின் அளவை இரட்டிப்பாக்குகிறது.
- ஆரம்ப இணைவு மல்டிமாடல்: லாமா 4 தொடர் “ஆரம்ப இணைவு” அணுகுமுறையை ஏற்றுக்கொண்டது, இது உரை மற்றும் பார்வை டோக்கன்களை ஒரு ஒருங்கிணைந்த மாதிரியில் ஒருங்கிணைக்கிறது. மெட்டாவின் கூற்றுப்படி, இந்த அணுகுமுறை காட்சி மற்றும் உரை தகவல்களுக்கு இடையே ஒரு இயற்கையான புரிதலை வளர்க்கிறது, தனித்தனி குறியாக்கிகள் மற்றும் டிகோடர்களின் தேவையை நீக்குகிறது.
- ஹைப்பர் அளவுரு தேர்வுமுறை: இந்த நுட்பத்தில் முக்கியமான மாதிரி ஹைப்பர் அளவுருக்களை நன்றாக மாற்றுவது, அடுக்குக்கு கற்றல் விகிதங்கள் போன்றவற்றை உள்ளடக்கியது, மேலும் நம்பகமான மற்றும் நிலையான பயிற்சி முடிவுகளை அடைய வேண்டும். இந்த அளவுருக்களை மேம்படுத்துவதன் மூலம், மெட்டா லாமா 4 இன் ஒட்டுமொத்த ஸ்திரத்தன்மை மற்றும் செயல்திறனை மேம்படுத்த முடிந்தது.
- iRoPE கட்டமைப்பு: நிலையான உட்பொதிப்பு கட்டமைப்புகள் இல்லாமல் குறுக்கீடு செய்யப்பட்ட கவன அடுக்குகள், அல்லது iRoPE கட்டமைப்பு, பயிற்சியின் போது நீண்ட வரிசைகளைக் கையாளுவதை மேம்படுத்துகிறது மற்றும் லாமா 4 ஸ்கவுட்டில் 10 மில்லியன் டோக்கன் சூழல் சாளரத்தை எளிதாக்குகிறது. இந்த கட்டமைப்பு உள்ளீட்டு வரிசையின் தொலைதூர பகுதிகளிலிருந்து தகவல்களைத் தக்கவைக்க மாதிரிக்கு உதவுகிறது, இது நீண்ட மற்றும் சிக்கலான ஆவணங்களை செயலாக்க உதவுகிறது.
- MetaCLIP விஷன் என்கோடர்: புதிய மெட்டா விஷன் என்கோடர் படங்களை டோக்கன் பிரதிநிதித்துவங்களாக மாற்றுகிறது, இது மேம்பட்ட மல்டிமாடல் புரிதலுக்கு வழிவகுக்கிறது. இந்த என்கோடர் லாமா 4 ஐ திறம்பட செயலாக்க மற்றும் காட்சி தகவல்களை விளக்க உதவுகிறது.
- GOAT பாதுகாப்பு பயிற்சி: LLM பாதிப்புகளை அடையாளம் கண்டு மாதிரி பாதுகாப்பை மேம்படுத்த ஜெனரேட்டிவ் ஆஃபென்சிவ் ஏஜென்ட் டெஸ்டர் (GOAT) பயிற்சி முழுவதும் மெட்டாவால் செயல்படுத்தப்பட்டது. இந்த நுட்பம் தீங்கு விளைவிக்கும் அல்லது பக்கச்சார்பான உள்ளடக்கத்தை உருவாக்கும் மாதிரியின் அபாயத்தை குறைக்க உதவுகிறது.
லாமா மாதிரிகளின் பரிணாமம்
நவம்பர் 2022 இல் ChatGPT இன் முன்னோடி வெளியீட்டைத் தொடர்ந்து, LLM சந்தையில் ஒரு இடத்தைப் பிடிப்பதற்கு தொழில்துறை முழுவதும் நிறுவனங்கள் பந்தயம் கட்டின. ஆரம்பத்தில் லாமா மாதிரிகளை 2023 இன் முற்பகுதியில் அறிமுகப்படுத்திய மெட்டா ஆரம்ப பதிலளிப்பாளர்களில் ஒருவராக இருந்தார், இருப்பினும் கட்டுப்படுத்தப்பட்ட அணுகலுடன். 2023 ஆம் ஆண்டின் நடுப்பகுதியில் லாமா 2 ஐ வெளியிட்டதிலிருந்து, அனைத்து அடுத்தடுத்த மாதிரிகளும் திறந்த உரிமங்களின் கீழ் கிடைக்கின்றன.
- லாமா 1: அசல் லாமா மாதிரி, பிப்ரவரி 2023 இல் வரையறுக்கப்பட்ட அணுகலுடன் தொடங்கப்பட்டது.
- லாமா 2: ஜூலை 2023 இல் திறந்த உரிமத்துடன் கூடிய முதல் லாமா மாதிரியாக வெளியிடப்பட்டது, லாமா 2 இலவச அணுகல் மற்றும் பயன்பாட்டை வழங்கியது. இந்த மறு செய்கையில் 7B, 13B மற்றும் 70B அளவுரு பதிப்புகள் உள்ளன, இது பல்வேறு கணக்கீட்டு தேவைகளுக்கு உதவுகிறது.
- லாமா 3: லாமா 3 மாதிரிகள் ஏப்ரல் 2024 இல் அறிமுகமானது, ஆரம்பத்தில் 8B மற்றும் 70B அளவுரு பதிப்புகளுடன்.
- லாமா 3.1: ஜூலை 2024 இல் தொடங்கப்பட்டது, லாமா 3.1 ஒரு 405B அளவுரு மாதிரியைச் சேர்த்தது, LLM திறன்களின் எல்லைகளைத் தள்ளியது.
- லாமா 3.2: இந்த மாதிரி, மெட்டாவின் முதல் முழு மல்டிமாடல் LLM, அக்டோபர் 2024 இல் வெளியிடப்பட்டது, இது லாமா குடும்பத்தின் வளர்ச்சியில் ஒரு குறிப்பிடத்தக்க மைல்கல்லைக் குறிக்கிறது.
- லாமா 3.3: டிசம்பர் 2024 வெளியீட்டில் லாமா 3.3 இன் 70B மாறுபாடு 3.1 இன் 405B மாறுபாட்டைப் போன்ற அதே செயல்திறனை வழங்கியது என்று மெட்டா கூறியது, அதே நேரத்தில் குறைவான கணக்கீட்டு ஆதாரங்கள் தேவைப்பட்டன, இது தொடர்ச்சியான தேர்வுமுறை முயற்சிகளை எடுத்துக்காட்டுகிறது.
மற்ற மாதிரிகளுடன் லாமா 4 ஐ ஒப்பிடுகையில்
ஜெனரேட்டிவ் AI இன் நிலப்பரப்பு பெருகிய முறையில் போட்டித்தன்மையுடன் மாறி வருகிறது, OpenAI இன் GPT-4o, Google Gemini 2.0 மற்றும் DeepSeek உள்ளிட்ட பல்வேறு திறந்த மூல திட்டங்கள் போன்ற முக்கிய வீரர்கள் இடம்பெற்றுள்ளனர்.
லாமா 4 இன் செயல்திறனை பல அளவுகோல்களைப் பயன்படுத்தி மதிப்பிடலாம், அவை பின்வருமாறு:
- MMMU (Massive Multi-discipline Multimodal Understanding): பட பகுத்தறிவு திறன்களை மதிப்பிடுகிறது.
- LiveCodeBench: குறியீட்டுத் திறனை மதிப்பிடுகிறது.
- GPQA Diamond (Graduate-Level Google-Proof Q&A Diamond): பகுத்தறிவு மற்றும் அறிவை அளவிடுகிறது.
இந்த அளவுகோல்களில் அதிக மதிப்பெண்கள் சிறந்த செயல்திறனைக் குறிக்கின்றன.
லாமா 4 மேவரிக் | ஜெமினி 2.0 ஃப்ளாஷ் | GPT-4o | |
---|---|---|---|
MMMU பட பகுத்தறிவு | 73.4 | 71.7 | 69.1 |
LiveCodeBench | 43.4 | 34.05 | 32.3 |
GPQA Diamond | 69.8 | 60.1 | 53.6 |
இந்த அளவுகோல்கள் லாமா 4 மேவரிக் பட பகுத்தறிவு, குறியீட்டு மற்றும் பொது அறிவு ஆகியவற்றில் உள்ள பலத்தை எடுத்துக்காட்டுகின்றன, இது LLM அரங்கில் ஒரு வலுவான போட்டியாளராக நிலைநிறுத்துகிறது.
லாமா 4 ஐ அணுகுதல்
மெட்டா லாமா 4 மேவரிக் மற்றும் ஸ்கவுட் பல்வேறு சேனல்கள் மூலம் எளிதாகக் கிடைக்கின்றன:
- Llama.com: மெட்டா இயக்கும் llama.com வலைத்தளத்திலிருந்து ஸ்கவுட் மற்றும் மேவரிக் ஆகியவற்றை நேரடியாக இலவசமாக பதிவிறக்கவும்.
- Meta.ai: Meta.ai வலை இடைமுகம் லாமா 4 க்கு உலாவி அடிப்படையிலான அணுகலை வழங்குகிறது, இது எந்த உள்ளூர் நிறுவலும் தேவையில்லாமல் மாதிரிக்கு பயனர் தொடர்பு கொள்ள அனுமதிக்கிறது.
- Hugging Face: லாமா 4 ஐ https://huggingface.co/meta-llama என்ற முகவரியிலும் அணுகலாம், இது இயந்திர கற்றல் மாதிரிகளைப் பகிர்வதற்கும் கண்டுபிடிப்பதற்கும் ஒரு பிரபலமான தளமாகும்.
- Meta AI App: லாமா 4 மெட்டாவின் AI மெய்நிகர் உதவியாளருக்கு உதவுகிறது, இது பல்வேறு தளங்களில் குரல் அல்லது உரை மூலம் அணுக முடியும். பயனர்கள் உரையைச் சுருக்குவது, உள்ளடக்கத்தை உருவாக்குவது மற்றும் கேள்விகளுக்குப் பதிலளிப்பது போன்ற பணிகளைச் செய்ய உதவியாளரைப் பயன்படுத்தலாம்.