Meta பதிலடி: Llama 4 பன்முக சக்தி, பரந்த சூழலுடன் AI களம்

AI மேலாதிக்கத்தின் மாறும் மணல் திட்டுகள்

செயற்கை நுண்ணறிவுத் தளம் 2025 ஆம் ஆண்டின் தொடக்கத்தில் ஒரு பூகம்ப அதிர்வை சந்தித்தது. DeepSeek R1 என்ற சக்திவாய்ந்த திறந்த மூல மொழி பகுத்தறிவு மாதிரியின் பொது வெளியீடு, ஒரு புதிய போட்டியாளரை அறிமுகப்படுத்தியது மட்டுமல்லாமல், நிறுவப்பட்ட படிநிலையையும் அடிப்படையில் சவால் செய்தது. DeepSeek R1-ன் செயல்திறன் அளவீடுகள், Meta Platforms உட்பட அமெரிக்க தொழில்நுட்ப ஜாம்பவான்களின் அதிக நிதி பெற்ற ஆராய்ச்சி ஆய்வகங்களால் உருவாக்கப்பட்டவற்றை விட சில அம்சங்களில் விஞ்சியதாக அறிக்கைகள் தெரிவித்தன. இந்த அசாத்தியமான திறன் கணிசமாக குறைந்த பயிற்சி செலவில் அடையப்பட்டது என்ற வெளிப்பாடு Silicon Valley முழுவதும், குறிப்பாக Meta-வின் தாழ்வாரங்களுக்குள், கவலையின் அலைகளை அனுப்பியது.

Meta-வைப் பொறுத்தவரை, இத்தகைய சக்திவாய்ந்த மற்றும் செலவு குறைந்த திறந்த மூல போட்டியாளரின் தோற்றம் அதன் உருவாக்கும் AI உத்தியின் இதயத்தைத் தாக்கியது. நிறுவனம் Llama பிராண்டின் கீழ் பெருகிய முறையில் திறமையான மாதிரிகளை வெளியிட்டு, திறந்த மூல இயக்கத்தை வழிநடத்துவதில் தனது உரிமையைக் கோரியது. உலகளாவிய ஆராய்ச்சி மற்றும் மேம்பாட்டு சமூகத்திற்கு அதிநவீன கருவிகளை வழங்குவதும், புதுமைகளை வளர்ப்பதும், Llama-வை திறந்த AI மேம்பாட்டிற்கான நடைமுறைத் தரமாக நிறுவுவதும் இதன் முக்கிய நோக்கமாக இருந்தது. DeepSeek R1-ன் வருகை வெளிப்படையாக தரத்தை உயர்த்தியது, Meta-வை தீவிர மூலோபாய மறுமதிப்பீடு மற்றும் துரிதப்படுத்தப்பட்ட மேம்பாட்டுக் காலத்திற்குத் தள்ளியது.

Meta-வின் பதில்: Llama 4 குடும்பம் அறிமுகம்

Meta-வின் பதிலின் உச்சக்கட்டம் நிறுவனர் மற்றும் CEO Mark Zuckerberg-ன் ஒரு குறிப்பிடத்தக்க அறிவிப்புடன் வந்தது. நிறுவனம் அதன் அடுத்த தலைமுறை Llama 4 தொடரை வெளியிட்டது, இது திறந்த மூல AI திறன்களின் எல்லைகளைப் பிடிப்பதற்கு மட்டுமல்லாமல், தள்ளுவதற்கும் வடிவமைக்கப்பட்ட மாதிரிகளின் குடும்பமாகும். உடனடியாக அமலுக்கு வரும் வகையில், இந்த புதிய குடும்பத்தின் இரண்டு உறுப்பினர்கள் உலகெங்கிலும் உள்ள டெவலப்பர்களுக்குக் கிடைத்தன:

  • Llama 4 Maverick: ஒரு கணிசமான 400-பில்லியன் பாராமீட்டர் மாடல்.
  • Llama 4 Scout: மிகவும் சுறுசுறுப்பான, இன்னும் சக்திவாய்ந்த, 109-பில்லியன் பாராமீட்டர் மாடல்.

இந்த மாதிரிகள் நேரடி பதிவிறக்கத்திற்காக வெளியிடப்பட்டன, ஆராய்ச்சியாளர்கள் மற்றும் நிறுவனங்கள் தாமதமின்றி அவற்றைப் பயன்படுத்தவும், நுண்-சரிசெய்யவும், தங்கள் சொந்த பயன்பாடுகளில் ஒருங்கிணைக்கவும் அதிகாரம் அளித்தன.

இந்த உடனடியாகக் கிடைக்கும் மாதிரிகளுடன், Meta Llama 4 Behemoth-ன் முன்னோட்டத்துடன் எதிர்காலத்தைப் பற்றிய ஒரு கவர்ச்சியான பார்வையை வழங்கியது. அதன் பெயர் குறிப்பிடுவது போல, இந்த மாடல் அளவில் ஒரு நினைவுச்சின்ன பாய்ச்சலைக் குறிக்கிறது, இது திகைப்பூட்டும் 2-டிரில்லியன் பாராமீட்டர்களைக் கொண்டுள்ளது. இருப்பினும், Behemoth இன்னும் அதன் தீவிர பயிற்சி செயல்முறைக்கு உட்பட்டுள்ளது என்றும், அதன் பொது வெளியீட்டிற்கான குறிப்பிட்ட காலக்கெடு எதுவும் வழங்கப்படவில்லை என்றும் Meta-வின் அதிகாரப்பூர்வ தகவல் தொடர்பு தெளிவுபடுத்தியது. அதன் தற்போதைய பங்கு ஒரு உள் அளவுகோல் அமைப்பாளராகவும், சிறிய கட்டமைப்புகளைச் செம்மைப்படுத்துவதற்கான ஒரு ‘ஆசிரியர்’ மாதிரியாகவும் இருக்கலாம்.

வரையறுக்கும் அம்சங்கள்: பன்முகத்தன்மை மற்றும் விரிவான சூழல்

Llama 4 தொடர் அதை வேறுபடுத்தும் பல அற்புதமான அம்சங்களை அறிமுகப்படுத்துகிறது. இவற்றில் முதன்மையானது இயல்பான பன்முகத்தன்மை ஆகும். பன்முகத் திறன்கள் இணைக்கப்பட்டிருக்கக்கூடிய முந்தைய தலைமுறைகளைப் போலல்லாமல், Llama 4 மாதிரிகள் உரை, வீடியோ மற்றும் படங்களை உள்ளடக்கிய பல்வேறு தரவுத்தொகுப்புகளில் அடிப்படையிலிருந்து பயிற்சி பெற்றன. இதன் விளைவாக, இந்த வெவ்வேறு தரவு வகைகளைக் கொண்ட தூண்டுதல்களைப் புரிந்துகொள்வதற்கும், உரை, வீடியோ மற்றும் படங்களையும் பரப்பக்கூடிய பதில்களை உருவாக்குவதற்கும் அவை இயல்பான திறனைக் கொண்டுள்ளன. குறிப்பிடத்தக்க வகையில், ஆடியோ செயலாக்க திறன்கள் ஆரம்ப அறிவிப்புகளில் குறிப்பிடப்படவில்லை.

மற்றொரு தலைப்புச் செய்தி திறன் புதிய மாதிரிகளால் வழங்கப்படும் வியத்தகு முறையில் விரிவாக்கப்பட்ட சூழல் சாளரம் ஆகும். சூழல் சாளரம் என்பது ஒரு மாதிரி ஒரு தொடர்பில் (உள்ளீடு மற்றும் வெளியீடு இரண்டும்) செயலாக்கக்கூடிய தகவலின் அளவைக் குறிக்கிறது. Llama 4 இந்த வரம்புகளை கணிசமாகத் தள்ளுகிறது:

  • Llama 4 Maverick: 1 மில்லியன் டோக்கன் சூழல் சாளரத்தைக் கொண்டுள்ளது. இது தோராயமாக 1,500 நிலையான பக்கங்களின் உரை உள்ளடக்கத்தை ஒரே நேரத்தில் செயலாக்குவதற்கு சமம்.
  • Llama 4 Scout: இன்னும் ஈர்க்கக்கூடிய 10 மில்லியன் டோக்கன் சூழல் சாளரத்தைக் கொண்டுள்ளது, இது தோராயமாக 15,000 பக்க உரைகளுக்குச் சமமான தகவலை ஒரே நேரத்தில் கையாளும் திறன் கொண்டது.

இந்த பரந்த சூழல் சாளரங்கள் நீண்ட ஆவணங்கள், விரிவான குறியீடு தளங்கள், நீண்ட உரையாடல்கள் அல்லது விரிவான பல-சுற்று பகுப்பாய்வு சம்பந்தப்பட்ட சிக்கலான பணிகளுக்கான புதிய சாத்தியங்களைத் திறக்கின்றன, முந்தைய மாதிரிகள் நினைவக வரம்புகள் காரணமாக அடிக்கடி போராடிய பகுதிகள்.

கட்டமைப்பு அடித்தளங்கள்: நிபுணர்களின் கலவை அணுகுமுறை

மூன்று Llama 4 மாதிரிகளையும் இயக்குவது அதிநவீன ‘நிபுணர்களின் கலவை’ (MoE) கட்டமைப்பாகும். இந்த வடிவமைப்பு முன்னுதாரணம் பெரிய அளவிலான AI மாதிரிகளின் வளர்ச்சியில் குறிப்பிடத்தக்க ஈர்ப்பைப் பெற்றுள்ளது. ஒற்றை, ஒற்றைக்கல் நரம்பியல் வலையமைப்பை உருவாக்குவதற்குப் பதிலாக, MoE பல சிறிய, சிறப்பு வாய்ந்த நெட்வொர்க்குகளை - ‘நிபுணர்கள்’ - ஒரு பெரிய கட்டமைப்பிற்குள் ஒருங்கிணைக்கிறது. ஒவ்வொரு நிபுணரும் குறிப்பிட்ட பணிகள், பாடங்கள் அல்லது உரை பகுப்பாய்வு மற்றும் பட அங்கீகாரம் போன்ற வெவ்வேறு தரவு முறைகளில் சிறந்து விளங்க பயிற்சி அளிக்கப்படுகிறார்கள்.

MoE கட்டமைப்பிற்குள் ஒரு ரூட்டிங் பொறிமுறையானது உள்வரும் தரவு அல்லது வினவல்களை செயலாக்க மிகவும் பொருத்தமான நிபுணர்(களு)க்கு வழிநடத்துகிறது. இந்த அணுகுமுறை பல நன்மைகளை வழங்குகிறது:

  1. செயல்திறன்: ஒரு குறிப்பிட்ட பணிக்கு தேவையான நிபுணர்கள் மட்டுமே செயல்படுத்தப்படுகிறார்கள், இது ஒரு முழு பெரிய மாதிரியைச் செயல்படுத்துவதை விட அனுமானத்தை (பதிலை உருவாக்கும் செயல்முறை) வேகமாகவும் கணக்கீட்டு ரீதியாக குறைந்த செலவிலும் ஆக்குகிறது.
  2. அளவிடுதல்: முழு அமைப்பையும் புதிதாகப் பயிற்றுவிக்க வேண்டிய அவசியமின்றி, அதிக நிபுணர்களைச் சேர்ப்பதன் மூலமோ அல்லது ஏற்கனவே உள்ளவர்களை மேலும் பயிற்றுவிப்பதன் மூலமோ மாதிரியின் திறன்களை அளவிடுவது கோட்பாட்டளவில் எளிதானது.
  3. சிறப்புத்தன்மை: பல்வேறு களங்களில் ஆழமான சிறப்புத்தன்மையை அனுமதிக்கிறது, இது குறிப்பிட்ட வகை பணிகளுக்கு உயர் தரமான வெளியீடுகளுக்கு வழிவகுக்கும்.

Llama 4 குடும்பத்திற்காக Meta MoE-ஐ ஏற்றுக்கொண்டது தொழில்துறை போக்குகளுடன் ஒத்துப்போகிறது மற்றும் கணக்கீட்டுத் திறனுடன் அதிநவீன செயல்திறனை சமநிலைப்படுத்துவதில் கவனம் செலுத்துவதை அடிக்கோடிட்டுக் காட்டுகிறது, குறிப்பாக பரந்த திறந்த மூல விநியோகத்திற்காக நோக்கம் கொண்ட மாதிரிகளுக்கு இது முக்கியமானது.

விநியோக உத்தி மற்றும் மேம்பாட்டு கவனம்

Meta Llama 4 வெளியீட்டின் மூலம் திறந்த அணுகலுக்கான தனது உறுதிப்பாட்டை வலுப்படுத்துகிறது. Llama 4 Scout மற்றும் Llama 4 Maverick இரண்டும் உடனடியாக சுய-ஹோஸ்டிங்கிற்கு கிடைக்கின்றன, இது தேவையான கணக்கீட்டு வளங்களைக் கொண்ட நிறுவனங்கள் தங்கள் சொந்த உள்கட்டமைப்பில் மாதிரிகளை இயக்க அனுமதிக்கிறது. இந்த அணுகுமுறை அதிகபட்ச கட்டுப்பாடு, தனிப்பயனாக்கம் மற்றும் தரவு தனியுரிமையை வழங்குகிறது.

சுவாரஸ்யமாக, Meta இந்த மாதிரிகளை அதன் சொந்த உள்கட்டமைப்பில் இயக்குவதற்கான அதிகாரப்பூர்வ ஹோஸ்ட் செய்யப்பட்ட API அணுகல் அல்லது தொடர்புடைய விலை நிர்ணய அடுக்குகளை அறிவிக்கவில்லை, இது OpenAI மற்றும் Anthropic போன்ற போட்டியாளர்களால் பயன்படுத்தப்படும் ஒரு பொதுவான பணமாக்குதல் உத்தியாகும். அதற்கு பதிலாக, ஆரம்ப கவனம் நேராக உள்ளது:

  1. திறந்த பதிவிறக்கம்: மாதிரி எடைகளை இலவசமாகக் கிடைக்கச் செய்தல்.
  2. தள ஒருங்கிணைப்பு: WhatsApp, Messenger, Instagram மற்றும் அதன் வலை இடைமுகங்களுக்குள் Meta AI செயல்பாடுகள் உட்பட Meta-வின் சொந்த நுகர்வோர் எதிர்கொள்ளும் தயாரிப்புகளில் புதிய Llama 4 திறன்களை தடையின்றி இணைத்தல்.

இந்த உத்தி Meta அதன் சொந்த பரந்த பயனர் சுற்றுச்சூழல் அமைப்பை மேம்படுத்த அதன் அதிநவீன AI-ஐ ஒரே நேரத்தில் பயன்படுத்தும் போது திறந்த மூல சமூகத்திற்குள் தத்தெடுப்பு மற்றும் புதுமைகளை இயக்க நோக்கமாகக் கொண்டுள்ளது என்று கூறுகிறது.

மூன்று Llama 4 மாதிரிகளுக்கும், குறிப்பாக பெரிய Maverick மற்றும் Behemoth-க்கும், மேம்பாட்டு முக்கியத்துவம் வெளிப்படையாக பகுத்தறிவு, குறியீட்டு முறை மற்றும் படிப்படியான சிக்கல் தீர்த்தல் ஆகியவற்றில் உள்ளது. இந்த தர்க்கரீதியான திறன்களை வலுப்படுத்த பிரத்யேகமாக வடிவமைக்கப்பட்ட தனிப்பயன் பிந்தைய பயிற்சி சுத்திகரிப்பு குழாய்களின் செயலாக்கத்தை Meta முன்னிலைப்படுத்தியது. பகுத்தறிவில் சக்திவாய்ந்ததாக இருந்தாலும், ஆரம்ப விளக்கங்கள் அவை OpenAI மாதிரிகள் அல்லது DeepSeek R1 போன்ற சிக்கலான பகுத்தறிவு பணிகளுக்காக குறிப்பாக வடிவமைக்கப்பட்ட மாதிரிகளின் வெளிப்படையான ‘சிந்தனைச் சங்கிலி’ செயல்முறைகளை இயல்பாக வெளிப்படுத்தாது என்று கூறுகின்றன.

குறிப்பிடத்தக்க ஒரு புதுமை MetaP ஆகும், இது Llama 4 திட்டத்தின் போது உருவாக்கப்பட்ட ஒரு நுட்பமாகும். இந்த கருவி பொறியாளர்கள் ஒரு மைய மாதிரியில் ஹைப்பர்பாராமீட்டர்களை அமைக்க அனுமதிப்பதன் மூலம் எதிர்கால மாதிரி மேம்பாட்டை நெறிப்படுத்த உறுதியளிக்கிறது, பின்னர் அதிலிருந்து பல்வேறு பிற மாதிரி வகைகளை திறமையாகப் பெறுகிறது, இது பயிற்சி செயல்திறன் மற்றும் செலவு சேமிப்புகளில் குறிப்பிடத்தக்க ஆதாயங்களுக்கு வழிவகுக்கும்.

டைட்டன்களை பெஞ்ச்மார்க் செய்தல்: Llama 4 செயல்திறன் அளவீடுகள்

போட்டி நிறைந்த AI நிலப்பரப்பில், செயல்திறன் அளவுகோல்கள் முன்னேற்றத்தின் பொதுவான மொழியாகும். Meta அதன் புதிய Llama 4 குடும்பம் நிறுவப்பட்ட தொழில்துறை தலைவர்கள் மற்றும் முந்தைய Llama தலைமுறைகளுக்கு எதிராக எவ்வாறு நிற்கிறது என்பதைக் காட்ட ஆர்வமாக இருந்தது.

Llama 4 Behemoth (2T பாராமீட்டர்கள் - முன்னோட்டம்)

இன்னும் பயிற்சியில் இருந்தாலும், Meta Behemoth-ஐ ஒரு சிறந்த போட்டியாளராக நிலைநிறுத்தும் பூர்வாங்க பெஞ்ச்மார்க் முடிவுகளைப் பகிர்ந்து கொண்டது, இது GPT-4.5, Google-ன் Gemini 2.0 Pro, மற்றும் Anthropic-ன் Claude Sonnet 3.7 போன்ற முக்கிய மாடல்களை பல முக்கிய பகுத்தறிவு மற்றும் அளவுசார் பெஞ்ச்மார்க்குகளில் விஞ்சுகிறது என்று கூறுகிறது:

  • MATH-500: கணித சிக்கல் தீர்க்கும் திறன்களை சோதிக்கும் ஒரு சவாலான பெஞ்ச்மார்க். Behemoth 95.0 மதிப்பெண்ணை அடைகிறது.
  • GPQA Diamond: பட்டதாரி நிலை கேள்வி-பதில் திறன்களை அளவிடுகிறது. Behemoth 73.7 மதிப்பெண்களைப் பெறுகிறது.
  • MMLU Pro (Massive Multitask Language Understanding): பரந்த அளவிலான பாடங்களில் அறிவை மதிப்பிடும் ஒரு விரிவான பெஞ்ச்மார்க். Behemoth 82.2 ஐ அடைகிறது.

Llama 4 Maverick (400B பாராமீட்டர்கள் - இப்போது கிடைக்கிறது)

உயர் செயல்திறன் கொண்ட பன்முக மாதிரியாக நிலைநிறுத்தப்பட்டுள்ளது, Maverick வலுவான முடிவுகளை நிரூபிக்கிறது, குறிப்பாக அவற்றின் பன்முகத் திறமைக்கு அறியப்பட்ட மாடல்களுக்கு எதிராக:

  • GPT-4o மற்றும் Gemini 2.0 Flash-ஐ பல பன்முக பகுத்தறிவு பெஞ்ச்மார்க்குகளில் விஞ்சுகிறது, அவற்றுள்:
    • ChartQA: விளக்கப்படங்களில் வழங்கப்பட்ட தரவைப் புரிந்துகொள்வது மற்றும் பகுத்தறிவது (90.0 vs. GPT-4o’s 85.7).
    • DocVQA: ஆவணப் படங்களின் அடிப்படையில் கேள்வி பதில் (94.4 vs. GPT-4o’s 92.8).
    • MathVista: பார்வைக்கு வழங்கப்படும் கணித சிக்கல்களைச் சமாளித்தல்.
    • MMMU: பாரிய பன்முக புரிதலை மதிப்பிடும் ஒரு பெஞ்ச்மார்க்.
  • DeepSeek v3.1 (ஒரு 45.8B பாராமீட்டர் மாடல்) உடன் போட்டித்தன்மையை நிரூபிக்கிறது, அதே நேரத்தில் செயலில் உள்ள பாராமீட்டர்களில் பாதிக்கும் குறைவாகப் பயன்படுத்துகிறது (MoE கட்டமைப்பு காரணமாக மதிப்பிடப்பட்ட 17B செயலில் உள்ள பாராமீட்டர்கள்), அதன் செயல்திறனை எடுத்துக்காட்டுகிறது.
  • ஒரு வலுவான MMLU Pro மதிப்பெண் 80.5 ஐ அடைகிறது.
  • Meta அதன் சாத்தியமான செலவு-செயல்திறனையும் முன்னிலைப்படுத்தியது, அனுமானச் செலவுகளை $0.19–$0.49 प्रति 1 மில்லியன் டோக்கன்கள் வரம்பில் மதிப்பிடுகிறது, இது சக்திவாய்ந்த AI-ஐ மேலும் அணுகக்கூடியதாக ஆக்குகிறது.

Llama 4 Scout (109B பாராமீட்டர்கள் - இப்போது கிடைக்கிறது)

செயல்திறன் மற்றும் பரந்த பயன்பாட்டிற்காக வடிவமைக்கப்பட்டுள்ளது, Scout ஒப்பிடக்கூடிய மாடல்களுக்கு எதிராக தன்னைத் தக்க வைத்துக் கொள்கிறது:

  • Mistral 3.1, Gemini 2.0 Flash-Lite, மற்றும் Gemma 3 போன்ற மாடல்களை பல பெஞ்ச்மார்க்குகளில் சமன் செய்கிறது அல்லது விஞ்சுகிறது:
    • DocVQA: 94.4 என்ற உயர் மதிப்பெண்ணை அடைகிறது.
    • MMLU Pro: மரியாதைக்குரிய 74.3 மதிப்பெண்களைப் பெறுகிறது.
    • MathVista: 70.7 ஐ அடைகிறது.
  • அதன் தனித்துவமான அம்சம் ஒப்பிடமுடியாத 10 மில்லியன் டோக்கன் சூழல் நீளம் ஆகும், இது மிகவும் நீண்ட ஆவணங்கள், சிக்கலான குறியீடு தளங்கள் அல்லது நீட்டிக்கப்பட்ட பல-சுற்று தொடர்புகளின் ஆழமான பகுப்பாய்வு தேவைப்படும் பணிகளுக்கு தனித்துவமாகப் பொருத்தமானது.
  • முக்கியமாக, Scout திறமையான வரிசைப்படுத்தலுக்காக வடிவமைக்கப்பட்டுள்ளது, இது ஒற்றை NVIDIA H100 GPU இல் திறம்பட இயங்கும் திறன் கொண்டது, இது வரையறுக்கப்பட்ட வன்பொருள் வளங்களைக் கொண்ட நிறுவனங்களுக்கு ஒரு குறிப்பிடத்தக்க கருத்தாகும்.

ஒப்பீட்டு பகுப்பாய்வு: Behemoth vs. பகுத்தறிவு நிபுணர்கள்

மேலும் சூழலை வழங்க, முன்னோட்டமிடப்பட்ட Llama 4 Behemoth-ஐ Meta-வின் துரிதப்படுத்தப்பட்ட மேம்பாட்டை ஆரம்பத்தில் தூண்டிய மாடல்களுடன் ஒப்பிடுவது - DeepSeek R1 மற்றும் OpenAI-ன் பகுத்தறிவு-மையப்படுத்தப்பட்ட ‘o’ தொடர் - ஒரு நுணுக்கமான படத்தை வெளிப்படுத்துகிறது. DeepSeek R1 (குறிப்பாக R1-32B மாறுபாடு அடிக்கடி மேற்கோள் காட்டப்படுகிறது) மற்றும் OpenAI o1 (குறிப்பாக o1-1217) ஆகியவற்றின் ஆரம்ப வெளியீடுகளிலிருந்து கிடைக்கும் பெஞ்ச்மார்க் தரவுப் புள்ளிகளைப் பயன்படுத்தி:

பெஞ்ச்மார்க் Llama 4 Behemoth DeepSeek R1 (32B வகை மேற்கோள்) OpenAI o1-1217
MATH-500 95.0 97.3 96.4
GPQA Diamond 73.7 71.5 75.7
MMLU Pro 82.2 90.8 (குறிப்பு: MMLU மதிப்பெண், Pro அல்ல) 91.8 (குறிப்பு: MMLU மதிப்பெண், Pro அல்ல)

(குறிப்பு: MMLU Pro-வில் நேரடி ஒப்பீடு கடினம், ஏனெனில் முந்தைய விளக்கப்படங்கள் பெரும்பாலும் R1/o1-க்கான நிலையான MMLU மதிப்பெண்களை மேற்கோள் காட்டின, இது பொதுவாக மிகவும் சவாலான MMLU Pro வகையை விட அதிக எண்களை அளிக்கிறது. Behemoth-ன் 82.2 MMLU Pro-வில் அதன் வகுப்பிற்கு ஒப்பீட்டளவில் இன்னும் மிகவும் வலுவானது, GPT-4.5 மற்றும் Gemini 2.0 Pro-வை விட அதிகமாக உள்ளது).

இந்த குறிப்பிட்ட ஒப்பீடுகளை விளக்குதல்:

  • MATH-500 பெஞ்ச்மார்க்கில், Llama 4 Behemoth DeepSeek R1 மற்றும் OpenAI o1-க்காக அறிவிக்கப்பட்ட மதிப்பெண்களை விட சற்று பின்தங்கியுள்ளது.
  • GPQA Diamond-க்கு, Behemoth மேற்கோள் காட்டப்பட்ட DeepSeek R1 மதிப்பெண்ணை விட ஒரு விளிம்பைக் காட்டுகிறது, ஆனால் OpenAI o1-க்கு சற்று பின்தங்கியுள்ளது.
  • MMLU-வில் (Behemoth-ன் MMLU Pro-வை மற்றவர்களுக்கான நிலையான MMLU உடன் ஒப்பிட்டு, வேறுபாட்டை ஒப்புக்கொண்டு), Behemoth-ன் மதிப்பெண் குறைவாக உள்ளது, இருப்பினும் Gemini 2.0 Pro மற்றும் GPT-4.5 போன்ற பிற பெரிய மாடல்களுடன் ஒப்பிடும்போது அதன் செயல்திறன் மிகவும் போட்டித்தன்மை வாய்ந்ததாக உள்ளது.

முக்கியமான விஷயம் என்னவென்றால், DeepSeek R1 மற்றும் OpenAI o1 போன்ற சிறப்பு வாய்ந்த பகுத்தறிவு மாதிரிகள் சில குறிப்பிட்ட பகுத்தறிவு-தீவிர பெஞ்ச்மார்க்குகளில் ஒரு விளிம்பைக் கொண்டிருக்கலாம் என்றாலும், Llama 4 Behemoth தன்னை ஒரு வலிமையான, அதிநவீன மாதிரியாக நிலைநிறுத்துகிறது, அதன் வகுப்பின் உச்சத்தில் அல்லது அதற்கு அருகில் செயல்படுகிறது, குறிப்பாக அதன் பரந்த திறன்கள் மற்றும் அளவைக் கருத்தில் கொள்ளும்போது. இது சிக்கலான பகுத்தறிவுத் துறையில் Llama குடும்பத்திற்கு ஒரு குறிப்பிடத்தக்க பாய்ச்சலைக் குறிக்கிறது.

பாதுகாப்பு மற்றும் பொறுப்பான வரிசைப்படுத்தலை வலியுறுத்துதல்

செயல்திறன் மேம்பாடுகளுடன், Meta மாதிரி சீரமைப்பு மற்றும் பாதுகாப்பிற்கான தனது உறுதிப்பாட்டை வலியுறுத்தியது. டெவலப்பர்கள் Llama 4-ஐ பொறுப்புடன் வரிசைப்படுத்த உதவும் வகையில் வடிவமைக்கப்பட்ட கருவிகளின் தொகுப்புடன் இந்த வெளியீடு வருகிறது:

  • Llama Guard: சாத்தியமான பாதுகாப்பற்ற உள்ளீடுகள் அல்லது வெளியீடுகளை வடிகட்ட உதவுகிறது.
  • Prompt Guard: தீங்கு விளைவிக்கும் பதில்களை வரவழைக்க வடிவமைக்கப்பட்ட விரோத தூண்டுதல்களைக் கண்டறிந்து தணிப்பதை நோக்கமாகக் கொண்டுள்ளது.
  • CyberSecEval: மாதிரி வரிசைப்படுத்தலுடன் தொடர்புடைய சைபர் பாதுகாப்பு அபாயங்களை மதிப்பிடுவதற்கான ஒரு கருவி.
  • Generative Offensive Agent Testing (GOAT): மாதிரிகளை ‘ரெட்-டீமிங்’ செய்வதற்கான ஒரு தானியங்கு அமைப்பு - பாதிப்புகள் மற்றும் சாத்தியமான தவறான பயன்பாட்டுக் காட்சிகளுக்காக அவற்றை முன்கூட்டியே சோதித்தல்.

இந்த நடவடிக்கைகள் AI மாதிரிகள் மிகவும் சக்திவாய்ந்ததாக மாறும்போது, வலுவான பாதுகாப்பு நெறிமுறைகள் மற்றும் சீரமைப்பு நுட்பங்கள் விரும்பத்தக்கவை மட்டுமல்ல, அவசியமானவை என்ற வளர்ந்து வரும் தொழில்துறை அளவிலான அங்கீகாரத்தைப் பிரதிபலிக்கின்றன.

Llama சுற்றுச்சூழல் அமைப்பு: தாக்கத்திற்குத் தயாராக உள்ளது

Llama 4 குடும்பத்தின் அறிமுகம் Meta மற்றும் பரந்த AI நிலப்பரப்பிற்கு ஒரு குறிப்பிடத்தக்க தருணத்தைக் குறிக்கிறது. மேம்பட்ட பன்முகத் திறன்கள், விதிவிலக்காக நீண்ட சூழல் சாளரங்கள், திறமையான MoE கட்டமைப்பு மற்றும் பகுத்தறிவில் வலுவான கவனம் ஆகியவற்றை இணைப்பதன் மூலம், Meta கட்டாயமான திறந்த மூல கருவிகளின் தொகுப்பை வழங்கியுள்ளது.

Scout மற்றும் Maverick இப்போது டெவலப்பர்களின் கைகளில் இருப்பதாலும், பிரம்மாண்டமான Behemoth எதிர்கால திறன்களுக்கு உயர் தரத்தை அமைப்பதாலும், Llama சுற்றுச்சூழல் அமைப்பு OpenAI, Anthropic, DeepSeek மற்றும் Google-ன் முன்னணி தனியுரிம மாடல்களுக்கு ஒரு சாத்தியமான, சக்திவாய்ந்த திறந்த மாற்றாக வலுவாக நிலைநிறுத்தப்பட்டுள்ளது. நிறுவன தர AI உதவியாளர்களை உருவாக்கும் டெவலப்பர்கள், AI அறிவியலின் எல்லைகளைத் தள்ளும் ஆராய்ச்சியாளர்கள் அல்லது பரந்த தரவுத்தொகுப்புகளின் ஆழமான பகுப்பாய்விற்கான கருவிகளை உருவாக்கும் பொறியாளர்களுக்கு, Llama 4 ஒரு திறந்த மூல தத்துவத்தில் அடித்தளமாக உள்ள நெகிழ்வான, உயர் செயல்திறன் விருப்பங்களை வழங்குகிறது மற்றும் அதிநவீன பகுத்தறிவு பணிகளை நோக்கி பெருகிய முறையில் சார்ந்திருக்கிறது. AI மேம்பாட்டின் அடுத்த கட்டம் கணிசமாக மிகவும் சுவாரஸ்யமாக மாறியுள்ளது.