Meta Llama 4 மாடல் தொகுப்பு அறிமுகம்

செயற்கை நுண்ணறிவின் (AI) இடைவிடாத முன்னேற்ற வேகம் குறையாமல் தொடர்கிறது, மேலும் Meta Platforms, Inc. அதன் Llama 4 தொடர் AI மாடல்களை வெளியிடுவதன் மூலம் ஒரு முக்கியப் பங்காற்றியாக இருக்க வேண்டும் என்ற தனது நோக்கத்தை உறுதியாகக் குறிக்கிறது. இந்த புதிய தலைமுறை Meta-வின் AI திறன்களில் ஒரு குறிப்பிடத்தக்க பரிணாம வளர்ச்சியைக் குறிக்கிறது, இது நிறுவனத்தின் சொந்த பரந்த பயன்பாட்டுச் சூழலை இயக்குவதற்கு மட்டுமல்லாமல், பரந்த டெவலப்பர் சமூகத்திற்கும் கிடைக்கச் செய்யும் வகையில் வடிவமைக்கப்பட்டுள்ளது. இந்த வெளியீட்டின் முன்னணிப் படையாக இரண்டு தனித்துவமான மாடல்கள் உள்ளன: Llama 4 Scout மற்றும் Llama 4 Maverick, ஒவ்வொன்றும் வெவ்வேறு செயல்பாட்டு அளவுகள் மற்றும் செயல்திறன் இலக்குகளுக்கு ஏற்ப வடிவமைக்கப்பட்டுள்ளன. மேலும், Meta தற்போது உருவாக்கத்தில் உள்ள இன்னும் சக்திவாய்ந்த மாடலான Llama 4 Behemoth பற்றிய ஒரு பார்வையை AI உலகிற்கு அளித்துள்ளது, இது AI செயல்திறனின் உச்சத்தில் எதிர்காலப் போட்டியாளராக நிலைநிறுத்தப்பட்டுள்ளது. இந்த பன்முனை வெளியீடு, பெரிய மொழி மாடல்களின் (LLMs) எல்லைகளைத் தள்ளுவதற்கும், OpenAI, Google மற்றும் Anthropic போன்ற ஜாம்பவான்கள் ஆதிக்கம் செலுத்தும் துறையில் தீவிரமாகப் போட்டியிடுவதற்கும் Meta-வின் உறுதிப்பாட்டை அடிக்கோடிட்டுக் காட்டுகிறது.

Llama 4 இரட்டையர்களைப் பிரித்தல்: Scout மற்றும் Maverick மைய நிலைக்கு வருகின்றன

Meta-வின் ஆரம்ப வெளியீடு AI நிலப்பரப்பின் வெவ்வேறு பிரிவுகளைக் குறிவைக்கும் இரண்டு மாடல்களில் கவனம் செலுத்துகிறது. அவை அணுகக்கூடிய சக்தி மற்றும் உயர்நிலை செயல்திறன் இரண்டையும் வழங்குவதற்கான ஒரு மூலோபாய முயற்சியைக் குறிக்கின்றன, இது பரந்த அளவிலான சாத்தியமான பயனர்கள் மற்றும் பயன்பாடுகளுக்கு உதவுகிறது.

Llama 4 Scout: விரிவான நினைவகத்துடன் கூடிய கச்சிதமான பவர்ஹவுஸ்

இந்த ஜோடியில் முதலாவதான Llama 4 Scout, செயல்திறன் மற்றும் அணுகல்தன்மையை மனதில் கொண்டு வடிவமைக்கப்பட்டுள்ளது. Meta அதன் ஒப்பீட்டளவில் மிதமான தடம் பற்றி குறிப்பிடுகிறது, இது ‘ஒற்றை Nvidia H100 GPU-வில் பொருந்தும்’ திறன் கொண்டது என்று கூறுகிறது. தற்போதைய AI சூழலில் இது ஒரு முக்கியமான விவரம், இங்கு உயர் செயல்திறன் கணினி வளங்களுக்கான அணுகல், குறிப்பாக H100 போன்ற தேடப்படும் GPU-க்கள், டெவலப்பர்கள் மற்றும் நிறுவனங்களுக்கு ஒரு குறிப்பிடத்தக்க தடையாக இருக்கலாம். Scout-ஐ அத்தகைய ஒற்றை அலகுக்குள் செயல்பட வடிவமைப்பதன் மூலம், Meta மேம்பட்ட AI திறன்களைப் பயன்படுத்துவதற்கான நுழைவுத் தடையை சாத்தியமாகக் குறைக்கிறது.

அதன் கச்சிதமான தன்மை இருந்தபோதிலும், Scout ஒரு வலிமையான செயல்திறன் கொண்டதாக வழங்கப்படுகிறது. Meta, Google-இன் Gemma 3 மற்றும் Gemini 2.0 Flash-Lite, அத்துடன் பிரபலமான திறந்த மூல மாடல் Mistral 3.1 உள்ளிட்ட அதன் வகுப்பில் உள்ள பல நிறுவப்பட்ட மாடல்களை இது மிஞ்சுகிறது என்று வலியுறுத்துகிறது. இந்தக் கூற்றுகள் ‘பரவலாக அறிவிக்கப்பட்ட அளவுகோல்களின் பரந்த வரம்பில்’ செயல்திறனை அடிப்படையாகக் கொண்டவை, இது பகுத்தறிவு, மொழி புரிதல் மற்றும் சிக்கல் தீர்க்கும் திறன்களை அளவிட வடிவமைக்கப்பட்ட பல்வேறு தரப்படுத்தப்பட்ட AI பணிகளில் திறனைக் குறிக்கிறது.

ஒருவேளை Scout-இன் மிகவும் குறிப்பிடத்தக்க அம்சங்களில் ஒன்று அதன் 10-மில்லியன்-டோக்கன் சூழல் சாளரம் (context window) ஆகும். சூழல் சாளரம் என்பது ஒரு கோரிக்கையைச் செயலாக்கும்போது ஒரு AI மாடல் அதன் செயலில் உள்ள நினைவகத்தில் வைத்திருக்கக்கூடிய தகவலின் அளவை வரையறுக்கிறது. ஒரு பெரிய சூழல் சாளரம், மாடல் மிக நீண்ட ஆவணங்களைப் புரிந்துகொள்ளவும் குறிப்பிடவும், நீட்டிக்கப்பட்ட உரையாடல்களில் ஒத்திசைவைப் பராமரிக்கவும், மேலும் அதிக அளவு தகவல்களைத் தக்கவைக்க வேண்டிய சிக்கலான பணிகளைக் கையாளவும் அனுமதிக்கிறது. 10-மில்லியன்-டோக்கன் திறன் கணிசமானது, இது விரிவான ஆவணப் பகுப்பாய்வு, கடந்தகால உரையாடலைத் துல்லியமாக நினைவில் கொள்ளும் அதிநவீன சாட்பாட் தொடர்புகள் மற்றும் பெரிய குறியீடு தளங்களின் அடிப்படையில் சிக்கலான குறியீடு உருவாக்கம் போன்ற பகுதிகளில் சாத்தியமான பயன்பாடுகளை செயல்படுத்துகிறது. இந்த பெரிய நினைவகம், அதன் கூறப்படும் செயல்திறன் மற்றும் அளவுகோல் செயல்திறனுடன் இணைந்து, வளத் தேவைகள் மற்றும் மேம்பட்ட திறன்களுக்கு இடையில் சமநிலையைத் தேடும் டெவலப்பர்களுக்கு Scout-ஐ ஒரு பல்துறை கருவியாக நிலைநிறுத்துகிறது.

Llama 4 Maverick: உயர்-பங்கு போட்டிக்கு அளவிடுதல்

மிகவும் சக்திவாய்ந்த உடன்பிறப்பாக நிலைநிறுத்தப்பட்டுள்ள Llama 4 Maverick, செயல்திறன் ஸ்பெக்ட்ரமின் உயர் முனையை குறிவைக்கிறது, இது OpenAI-இன் GPT-4o மற்றும் Google-இன் Gemini 2.0 Flash போன்ற தொழில்துறை ஜாம்பவான்களுடன் ஒப்பிடப்படுகிறது. இது Maverick அதிக நுணுக்கம், படைப்பாற்றல் மற்றும் சிக்கலான பகுத்தறிவு தேவைப்படும் பணிகளுக்காக வடிவமைக்கப்பட்டுள்ளது என்பதைக் குறிக்கிறது. Meta, Maverick-இன் போட்டித்தன்மையை வலியுறுத்துகிறது, உள் சோதனை மற்றும் அளவுகோல் முடிவுகளின் அடிப்படையில் இந்த முக்கியப் போட்டியாளர்களுக்கு எதிராக சிறந்த செயல்திறனைக் கோருகிறது.

Maverick-இன் சுயவிவரத்தின் ஒரு சுவாரஸ்யமான அம்சம் அதன் சக்திக்கு ஏற்ப அதன் கூறப்படும் செயல்திறன் ஆகும். Meta, Maverick குறிப்பாக குறியீட்டு முறை மற்றும் பகுத்தறிவுப் பணிகளில் DeepSeek-V3 உடன் ஒப்பிடக்கூடிய முடிவுகளை அடைகிறது, அதே நேரத்தில் ‘பாதிக்கும் குறைவான செயலில் உள்ள அளவுருக்களைப் (active parameters)’ பயன்படுத்துகிறது என்று குறிப்பிடுகிறது. ஒரு AI மாடலில் உள்ள அளவுருக்கள் ஒரு மூளையில் உள்ள நியூரான்களுக்கு இடையிலான இணைப்புகளைப் போன்றவை; அதிக அளவுருக்கள் பொதுவாக அதிக சாத்தியமான சிக்கலான தன்மை மற்றும் திறனுடன் தொடர்புடையவை, ஆனால் அதிக கணக்கீட்டுச் செலவும் கூட. Maverick உண்மையில் கணிசமாகக் குறைவான செயலில் உள்ள அளவுருக்களுடன் (குறிப்பாக Mixture of Experts போன்ற நுட்பங்களைப் பயன்படுத்தும்போது, பின்னர் விவாதிக்கப்படும்) உயர்நிலை செயல்திறனை வழங்க முடிந்தால், இது மாடல் மேம்படுத்தலில் ஒரு குறிப்பிடத்தக்க சாதனையாகும், இது ஒத்த திறன் கொண்ட மாடல்களுடன் ஒப்பிடும்போது வேகமான மறுமொழி நேரங்களுக்கும் குறைக்கப்பட்ட செயல்பாட்டுச் செலவுகளுக்கும் வழிவகுக்கும். மூல சக்தியுடன் செயல்திறனில் இந்த கவனம், முழுமையான அதிகபட்ச கணக்கீட்டுச் சுமையைச் சுமக்காமல் அதிநவீன AI தேவைப்படும் நிறுவனங்களுக்கு Maverick-ஐ ஒரு கவர்ச்சிகரமான விருப்பமாக மாற்றும்.

Scout மற்றும் Maverick இரண்டும் Meta-விலிருந்து நேரடியாகவும், AI மாடல்கள் மற்றும் தரவுத்தொகுப்புகளைப் பகிர்வதற்கான பிரபலமான தளமான Hugging Face வழியாகவும் பதிவிறக்கம் செய்யக் கிடைக்கின்றன. இந்த விநியோக உத்தி ஆராய்ச்சி மற்றும் மேம்பாட்டு சமூகங்களுக்குள் தத்தெடுப்பை வளர்ப்பதை நோக்கமாகக் கொண்டுள்ளது, இது வெளிப்புறக் கட்சிகள் இந்த மாடல்களை மதிப்பீடு செய்யவும், உருவாக்கவும் மற்றும் அவற்றின் சொந்த திட்டங்களில் ஒருங்கிணைக்கவும் அனுமதிக்கிறது.

சமூக கட்டமைப்பில் AI-ஐ நெய்தல்: Meta-வின் தளங்களில் Llama 4 ஒருங்கிணைப்பு

முக்கியமாக, Llama 4 மாடல்கள் வெறும் தத்துவார்த்த கட்டமைப்புகள் அல்லது வெளிப்புற டெவலப்பர்களுக்கான கருவிகள் மட்டுமல்ல. Meta இந்த புதிய தொழில்நுட்பத்தை அதன் சொந்த பயனர் எதிர்கொள்ளும் தயாரிப்புகளை மேம்படுத்த உடனடியாகப் பயன்படுத்துகிறது. Meta AI assistant, நிறுவனத்தின் உரையாடல் AI, அதன் பல்வேறு சேவைகளில் பயனர்களுக்கு உதவ வடிவமைக்கப்பட்டுள்ளது, இப்போது Llama 4 மூலம் இயக்கப்படுகிறது.

இந்த ஒருங்கிணைப்பு Meta-வின் மிகவும் பிரபலமான தளங்களில் பரவியுள்ளது:

  • Meta AI-க்கான வலை இடைமுகம்: மேம்படுத்தப்பட்ட உதவியாளருடன் பயனர்கள் தொடர்பு கொள்ள ஒரு பிரத்யேக போர்ட்டலை வழங்குகிறது.
  • WhatsApp: உலகின் மிகவும் பரவலாகப் பயன்படுத்தப்படும் செய்தியிடல் பயன்பாட்டில் நேரடியாக மேம்பட்ட AI திறன்களைக் கொண்டுவருகிறது.
  • Messenger: Meta-வின் மற்ற முக்கியத் தகவல் தொடர்பு தளத்தை Llama 4-இன் சக்தியுடன் மேம்படுத்துகிறது.
  • Instagram: காட்சி மைய சமூக வலைப்பின்னலுக்குள் உள்ளடக்க உருவாக்கம், தேடல் அல்லது நேரடி செய்தியிடல் தொடர்பான AI அம்சங்களை ஒருங்கிணைக்கிறது.

இந்த பரவலான வரிசைப்படுத்தல், மேம்பட்ட AI திறன்களை பில்லியன் கணக்கான பயனர்களுக்கு சுற்றுப்புறமாகவும் அணுகக்கூடியதாகவும் மாற்றுவதில் ஒரு பெரிய படியைக் குறிக்கிறது. இறுதிப் பயனருக்கு, இது Meta AI உதவியாளருடன் மிகவும் பயனுள்ள, சூழல்-விழிப்புணர்வு மற்றும் திறமையான தொடர்புகளாக மொழிபெயர்க்கப்படலாம். நீண்ட அரட்டைத் தொடர்களைச் சுருக்குதல், செய்திகளை வரைவு செய்தல், ஆக்கப்பூர்வமான உரை வடிவங்களை உருவாக்குதல், தகவல்களைக் கண்டறிதல் அல்லது படங்களை உருவாக்குதல் போன்ற பணிகள் கணிசமாக மிகவும் அதிநவீனமாகவும் நம்பகமானதாகவும் மாறக்கூடும்.

Meta-வின் கண்ணோட்டத்தில், இந்த ஒருங்கிணைப்பு பல மூலோபாய நோக்கங்களுக்கு உதவுகிறது. முதலாவதாக, இது அதன் முக்கியத் தயாரிப்புகளில் பயனர் அனுபவத்தை மேம்படுத்துகிறது, இது ஈடுபாடு மற்றும் தள ஒட்டுதலை அதிகரிக்கும். இரண்டாவதாக, இது Llama 4-க்கான இணையற்ற நிஜ-உலக சோதனைத் தளத்தை வழங்குகிறது, இது பரந்த அளவிலான தொடர்புத் தரவை (தனியுரிமைக் கொள்கைகளின்படி அநாமதேயமாக்கப்பட்டுப் பயன்படுத்தப்படும்) உருவாக்குகிறது, இது மேம்பாட்டிற்கான பகுதிகளை அடையாளம் காண்பதற்கும் எதிர்கால மாடல் மறு செய்கைகளைப் பயிற்றுவிப்பதற்கும் விலைமதிப்பற்றதாக இருக்கும். இது Meta-வின் பாரிய பயனர் தளத்தைப் பயன்படுத்தி அதன் AI தொழில்நுட்பத்தைத் தொடர்ந்து செம்மைப்படுத்த, ஒரு சக்திவாய்ந்த பின்னூட்ட வளையத்தை திறம்பட உருவாக்குகிறது. இந்த ஒருங்கிணைப்பு Meta-வின் AI முயற்சிகளை மிகவும் புலப்படும் மற்றும் அதன் முதன்மை வணிகத்தில் நேரடியாக தாக்கத்தை ஏற்படுத்துகிறது.

Behemoth-இன் நிழல்: Meta-வின் உயர்நிலை லட்சியங்களின் ஒரு பார்வை

Scout மற்றும் Maverick நிகழ்காலத்தைக் குறிக்கும் அதே வேளையில், Meta ஏற்கனவே Llama 4 Behemoth உடன் அதன் எதிர்காலப் பாதையைக் குறிக்கிறது. இந்த மாடல், இன்னும் தீவிரப் பயிற்சிச் செயல்பாட்டில் உள்ளது, Meta-வின் இறுதி பவர்ஹவுஸாக நிலைநிறுத்தப்பட்டுள்ளது, இது AI திறனின் உச்சத்தில் போட்டியிட வடிவமைக்கப்பட்டுள்ளது. Meta CEO Mark Zuckerberg, இது ‘உலகின் மிக உயர்ந்த செயல்திறன் கொண்ட அடிப்படை மாடலாக’ இருக்க வேண்டும் என்று தைரியமாகக் கூறியுள்ளார்.

Behemoth பற்றிப் பகிரப்பட்ட புள்ளிவிவரங்கள் திகைப்பூட்டுகின்றன: இது 288 பில்லியன் செயலில் உள்ள அளவுருக்களைக் கொண்டுள்ளது, இது 2 டிரில்லியன் அளவுருக்களின் மொத்தக் குளத்திலிருந்து எடுக்கப்பட்டது. இந்த மகத்தான அளவு அதை எல்லைப்புற மாடல்களின் வகைகளில் உறுதியாக வைக்கிறது, தற்போது கிடைக்கக்கூடிய அல்லது வதந்தியான சில பெரிய மாடல்களுடன் ஒப்பிடக்கூடிய அளவில் அல்லது சாத்தியமாக அதை மிஞ்சும். ‘செயலில்’ மற்றும் ‘மொத்த’ அளவுருக்களுக்கு இடையிலான வேறுபாடு, Mixture of Experts (MoE) கட்டமைப்பைப் பயன்படுத்துவதைக் குறிக்கிறது, அங்கு எந்தவொரு குறிப்பிட்ட பணிக்கும் மொத்த அளவுருக்களின் ஒரு பகுதி மட்டுமே ஈடுபடுத்தப்படுகிறது, இது அனுமானத்தின் போது விகிதாசார பாரிய கணக்கீட்டுச் செலவு இல்லாமல் பாரிய அளவை அனுமதிக்கிறது.

Behemoth இன்னும் வெளியிடப்படவில்லை என்றாலும், Meta அதன் தற்போதைய வளர்ச்சியின் அடிப்படையில் செயல்திறன் கோரிக்கைகளை ஏற்கனவே செய்து வருகிறது. நிறுவனம், GPT-4.5 (ஒரு கற்பனையான அல்லது வரவிருக்கும் OpenAI மாடல்) மற்றும் Claude Sonnet 3.7 (Anthropic-இலிருந்து எதிர்பார்க்கப்படும் மாடல்) போன்ற வலிமையான போட்டியாளர்களை குறிப்பாக ‘பல STEM அளவுகோல்களில்’ மிஞ்ச முடியும் என்று பரிந்துரைக்கிறது. STEM (அறிவியல், தொழில்நுட்பம், பொறியியல் மற்றும் கணிதம்) அளவுகோல்கள் குறிப்பாக சவாலான சோதனைகளாகும், இது சிக்கலான கணித பகுத்தறிவு, அறிவியல் புரிதல் மற்றும் குறியீட்டுத் திறன் போன்ற பகுதிகளில் ஒரு AI-இன் திறனை மதிப்பீடு செய்ய வடிவமைக்கப்பட்டுள்ளது. இந்த களங்களில் வெற்றி பெரும்பாலும் ஒரு மாடலின் மேம்பட்ட அறிவாற்றல் திறன்களின் முக்கிய குறிகாட்டியாகக் காணப்படுகிறது.

Behemoth-இன் வளர்ச்சி, AI பந்தயத்தில் பங்கேற்பது மட்டுமல்லாமல், அதை வழிநடத்துவதற்கும், உணரப்பட்ட முன்னணி வீரர்களை நேரடியாக சவால் செய்வதற்கும் Meta-வின் லட்சியத்தை அடிக்கோடிட்டுக் காட்டுகிறது. இத்தகைய ஒரு பிரம்மாண்டமான மாடலைப் பயிற்றுவிக்க மகத்தான கணக்கீட்டு வளங்கள், குறிப்பிடத்தக்க பொறியியல் நிபுணத்துவம் மற்றும் பரந்த தரவுத்தொகுப்புகள் தேவைப்படுகின்றன, இது AI ஆராய்ச்சி மற்றும் மேம்பாட்டில் Meta-வின் முதலீட்டின் அளவை எடுத்துக்காட்டுகிறது. Behemoth-இன் இறுதி வெளியீடு, எப்போது நடந்தாலும், அதிநவீன AI செயல்திறனுக்கான ஒரு சாத்தியமான புதிய அளவுகோலாக உன்னிப்பாகக் கவனிக்கப்படும்.

கட்டடக்கலை பரிணாமம்: Mixture of Experts (MoE)-ஐத் தழுவுதல்

Llama 4 தலைமுறையை ஆதரிக்கும் ஒரு முக்கிய தொழில்நுட்ப மாற்றம் Meta-வின் ‘mixture of experts’ (MoE) கட்டமைப்பை ஏற்றுக்கொள்வதாகும். இது பாரம்பரிய அடர்த்தியான மாடல் கட்டமைப்புகளிலிருந்து ஒரு குறிப்பிடத்தக்க புறப்பாட்டைக் குறிக்கிறது, அங்கு ஒவ்வொரு கணக்கீட்டிற்கும் மாடலின் அனைத்துப் பகுதிகளும் செயல்படுத்தப்படுகின்றன.

ஒரு MoE கட்டமைப்பில், மாடல் கருத்தியல் ரீதியாக பல சிறிய ‘நிபுணர்’ துணை நெட்வொர்க்குகளாகப் பிரிக்கப்பட்டுள்ளது, ஒவ்வொன்றும் வெவ்வேறு வகையான தரவு அல்லது பணிகளில் நிபுணத்துவம் பெற்றவை. ஒரு கேட்டிங் பொறிமுறை, அடிப்படையில் ஒரு போக்குவரத்துக் கட்டுப்பாட்டாளர், உள்வரும் தரவை அந்த குறிப்பிட்ட தகவலைச் செயலாக்கத் தேவையான மிகவும் பொருத்தமான நிபுணர்(களு)க்கு மட்டுமே அனுப்புகிறது.

இந்த அணுகுமுறையின் முதன்மை நன்மைகள்:

  1. கணக்கீட்டுத் திறன்: எந்தவொரு உள்ளீட்டிற்கும் மாடலின் மொத்த அளவுருக்களின் ஒரு பகுதியை மட்டுமே செயல்படுத்துவதன் மூலம், MoE மாடல்கள் ஒத்த மொத்த அளவு கொண்ட அடர்த்தியான மாடல்களுடன் ஒப்பிடும்போது அனுமானத்தின் போது (வெளியீட்டை உருவாக்கும் செயல்முறை) கணிசமாக வேகமாகவும் குறைந்த கணக்கீட்டுச் செலவுடனும் இருக்கும். பெரிய மாடல்களை செலவு குறைந்த முறையில் வரிசைப்படுத்துவதற்கும் பயனர் தொடர்புகளில் குறைந்த தாமதத்தை அடைவதற்கும் இது முக்கியமானது.
  2. அளவிடுதல்: MoE, ஒவ்வொரு அனுமான படிக்கும் கணக்கீட்டுத் தேவைகளில் அதற்கேற்ப நேரியல் அதிகரிப்பு இல்லாமல், மிகப் பெரிய மொத்த அளவுரு எண்ணிக்கைகளைக் கொண்ட மாடல்களை (Behemoth-இன் 2 டிரில்லியன் போன்றவை) உருவாக்க அனுமதிக்கிறது. இது அடர்த்தியான கட்டமைப்புகளுடன் நடைமுறைக்கு மாறாக இருக்கக்கூடிய மாடல் திறனை அளவிட உதவுகிறது.
  3. நிபுணத்துவம்: ஒவ்வொரு நிபுணரும் மிகவும் சிறப்பு வாய்ந்த அறிவை உருவாக்க முடியும், இது எல்லாவற்றையும் கையாள முயற்சிக்கும் ஒற்றை ஒற்றைக்கல் மாடலுடன் ஒப்பிடும்போது குறிப்பிட்ட வகை பணிகளில் சிறந்த செயல்திறனுக்கு வழிவகுக்கும்.

Llama 4-க்கு MoE-க்கு Meta-வின் மாற்றம் AI துறையில் ஒரு பரந்த போக்குடன் ஒத்துப்போகிறது, Google மற்றும் Mistral AI போன்ற நிறுவனங்களும் தங்கள் முன்னணி மாடல்களில் இந்த நுட்பத்தைப் பயன்படுத்துகின்றன. AI மேம்பாடு மற்றும் வரிசைப்படுத்தலின் அதிகரித்து வரும் செலவுகளை நிர்வகிக்கும் போது செயல்திறன் உறையைத் தள்ளுவதில் கட்டடக்கலை கண்டுபிடிப்பு வெறும் அளவைப் போலவே முக்கியமானது என்பதைப் பற்றிய வளர்ந்து வரும் புரிதலை இது பிரதிபலிக்கிறது. இந்த கட்டடக்கலைத் தேர்வு Maverick (குறைவான செயலில் உள்ள அளவுருக்களுடன் உயர் செயல்திறனை அடைதல்) மற்றும் பாரிய Behemoth மாடலைப் பயிற்றுவிப்பதற்கான சாத்தியக்கூறு ஆகிய இரண்டிற்கும் கூறப்படும் செயல்திறன் மற்றும் செயல்திறனுக்கு கணிசமாக பங்களிக்கிறது. Meta-வின் MoE செயலாக்கத்தின் பிரத்தியேகங்கள் AI ஆராய்ச்சியாளர்களுக்கு மிகுந்த ஆர்வமாக இருக்கும்.

‘திறந்த’ என்பதன் சிக்கல்கள்: Llama 4 மற்றும் உரிமக் கேள்வி

Meta அதன் Llama மாடல்களை, புதிய Llama 4 குடும்பம் உட்பட, ‘திறந்த மூல’ (open-source) என்று தொடர்ந்து முத்திரை குத்துகிறது. இருப்பினும், இந்தச் சொல்லாட்சி, Llama உரிமத்தின் குறிப்பிட்ட விதிமுறைகள் காரணமாக தொழில்நுட்ப சமூகத்திற்குள் ஒரு சர்ச்சைக்குரிய புள்ளியாக உள்ளது. மாடல்கள் பதிவிறக்கம் மற்றும் மாற்றத்திற்காக பொதுவில் கிடைக்கச் செய்யப்பட்டாலும், உரிமத்தில் பாரம்பரிய திறந்த மூல வரையறைகளிலிருந்து வேறுபடுத்தும் கட்டுப்பாடுகள் உள்ளன.

மிக முக்கியமான கட்டுப்பாடு என்னவென்றால், மாதாந்திர 700 மில்லியனுக்கும் அதிகமான செயலில் உள்ள பயனர்களை (MAU) பெருமைப்படுத்தும் வணிக நிறுவனங்கள் தங்கள் தயாரிப்புகள் அல்லது சேவைகளில் Llama 4 மாடல்களைப் பயன்படுத்துவதற்கு முன்பு Meta-விடமிருந்து குறிப்பிட்ட அனுமதியைப் பெற வேண்டும். இந்த வரம்பு Meta-வின் மிகப்பெரிய போட்டியாளர்களை - Google, Microsoft, Apple, ByteDance மற்றும் பிற சாத்தியமான நிறுவனங்களை - திறம்பட குறிவைக்கிறது, ஒரு தனி ஒப்பந்தம் இல்லாமல் Meta-வின் மேம்பட்ட AI தொழில்நுட்பத்தை சுதந்திரமாகப் பயன்படுத்துவதைத் தடுக்கிறது.

இந்த உரிம அணுகுமுறை, திறந்த மூலத்தின் வரையறையின் பரவலாக மதிக்கப்படும் பொறுப்பாளரான Open Source Initiative (OSI)-இடமிருந்து குறிப்பாக விமர்சனத்தைப் பெற்றுள்ளது. 2023 ஆம் ஆண்டில், இதேபோன்ற கட்டுப்பாடுகளைக் கொண்ட முந்தைய Llama பதிப்புகள் குறித்து, OSI அத்தகைய வரம்புகள் உரிமத்தை ‘திறந்த மூல’ வகையிலிருந்து வெளியேற்றுகின்றன என்று கூறியது. OSI-வரையறுக்கப்பட்ட திறந்த மூலத்தின் முக்கியக் கொள்கை பாகுபாடு காட்டாமை ஆகும், அதாவது உரிமங்கள் மென்பொருளை யார் பயன்படுத்தலாம் அல்லது எந்த நோக்கத்திற்காக பயன்படுத்தலாம் என்பதைக் கட்டுப்படுத்தக்கூடாது, இதில் பெரிய போட்டியாளர்களால் வணிகப் பயன்பாடும் அடங்கும்.

Meta-வின் மூலோபாயத்தை தூய திறந்த மூலத்தை விட ‘திறந்த அணுகல்’ அல்லது ‘சமூக உரிமம்’ வடிவமாக விளக்கலாம். இது ஆராய்ச்சியாளர்கள், ஸ்டார்ட்அப்கள், சிறிய நிறுவனங்கள் மற்றும் தனிப்பட்ட டெவலப்பர்களுக்கு பரந்த அணுகலை அனுமதிக்கிறது, புதுமைகளை வளர்க்கிறது மற்றும் Llama-வைச் சுற்றி ஒரு சுற்றுச்சூழல் அமைப்பைக் கட்டமைக்கிறது. இது வளர்ச்சியை விரைவுபடுத்தலாம், பிழைகளைக் கண்டறியலாம் மற்றும் நல்லெண்ணத்தை உருவாக்கலாம். இருப்பினும், பெரிய நிறுவனங்கள் மீதான கட்டுப்பாடு Meta-வின் போட்டி நிலையைப் பாதுகாக்கிறது, அதன் நேரடிப் போட்டியாளர்கள் Llama-வின் முன்னேற்றங்களை தங்கள் சொந்த சாத்தியமான போட்டி AI சேவைகளில் எளிதாக இணைப்பதைத் தடுக்கிறது.

இந்த நுணுக்கமான அணுகுமுறை AI மேம்பாட்டில் பில்லியன் கணக்கில் முதலீடு செய்யும் நிறுவனங்களுக்கான சிக்கலான மூலோபாயக் கருத்தாய்வுகளைப் பிரதிபலிக்கிறது. அவர்கள் சமூக ஈடுபாடு மற்றும் பரந்த தத்தெடுப்பின் நன்மைகளைத் தேடுகிறார்கள், அதே நேரத்தில் தங்கள் முக்கிய தொழில்நுட்ப நன்மைகளை தங்கள் முதன்மை சந்தை எதிரிகளுக்கு எதிராகப் பாதுகாக்கிறார்கள். இந்த விவாதம், உருவாக்கும் AI-இன் உயர்-பங்கு உலகில் திறந்த தன்மையின் வளர்ந்து வரும் தன்மையை எடுத்துக்காட்டுகிறது, அங்கு கூட்டு வளர்ச்சிக்கும் போட்டி மூலோபாயத்திற்கும் இடையிலான கோடுகள் பெருகிய முறையில் மங்கலாகின்றன. Llama 4-ஐக் கருத்தில் கொள்ளும் டெவலப்பர்கள் மற்றும் நிறுவனங்கள், குறிப்பாக அவர்கள் குறிப்பிடத்தக்க அளவில் செயல்பட்டால், இணக்கத்தை உறுதிப்படுத்த உரிம விதிமுறைகளை கவனமாக மதிப்பாய்வு செய்ய வேண்டும்.

மூலோபாயக் கணக்கீடு: பெரிய AI அரங்கில் Llama 4

Llama 4-இன் வெளியீடு ஒரு தொழில்நுட்பப் புதுப்பிப்பை விட மேலானது; இது நடந்து கொண்டிருக்கும் AI ஆயுதப் போட்டியில் Meta-வின் ஒரு குறிப்பிடத்தக்க மூலோபாய நகர்வு ஆகும். Scout, Maverick-ஐ வெளியிட்டு Behemoth-ஐ முன்னோட்டமிடுவதன் மூலம், Meta வெவ்வேறு செயல்திறன் அடுக்குகளில் போட்டியிடக்கூடிய அடிப்படை AI மாடல்களின் முன்னணி டெவலப்பராக அதன் நிலையை உறுதிப்படுத்துகிறது.

பல மூலோபாயக் கூறுகள் தெளிவாகத் தெரிகின்றன:

  • போட்டி நிலைப்படுத்தல்: OpenAI, Google, Mistral மற்றும் DeepSeek ஆகியவற்றின் மாடல்களுடனான நேரடி ஒப்பீடுகள், நிறுவப்பட்ட தலைவர்கள் மற்றும் முக்கியத் திறந்த மூல மாற்றுகளை நேருக்கு நேர் சவால் செய்ய Meta-வின் நோக்கத்தை நிரூபிக்கின்றன. முக்கிய அளவுகோல்களில் போட்டித்தன்மை வாய்ந்த அல்லது உயர்ந்ததாகக் கூறப்படும் மாடல்களை வழங்குவது டெவலப்பர் கவனத்தையும் சந்தைப் பங்கையும் கைப்பற்றுவதை நோக்கமாகக் கொண்டுள்ளது.
  • சுற்றுச்சூழல் மேம்பாடு: Llama 4-ஐ WhatsApp, Messenger மற்றும் Instagram-இல் ஒருங்கிணைப்பது உடனடியாக Meta-வின் பாரிய பயனர் தளத்தைப் பயன்படுத்துகிறது, இது உறுதியான தயாரிப்பு மேம்பாடுகளை வழங்குகிறது மற்றும் அதன் தளங்களின் மதிப்பை வலுப்படுத்துகிறது.
  • டெவலப்பர் சமூக ஈடுபாடு: Scout மற்றும் Maverick-ஐப் பதிவிறக்கம் செய்யக் கிடைப்பது Llama-வைச் சுற்றி ஒரு சமூகத்தை வளர்க்கிறது, வெளிப்புறப் புதுமைகளை ஊக்குவிக்கிறது மற்றும் Meta பயனடையக்கூடிய திறமை மற்றும் யோசனைகளின் ஒரு குழாய்த்தொடரை சாத்தியமாக உருவாக்குகிறது. ‘திறந்த’ உரிமம், அதன் எச்சரிக்கைகள் இருந்தபோதிலும், OpenAI-இன் மிகவும் மேம்பட்ட மாடல்கள் போன்ற சில போட்டியாளர்களின் மூடிய அணுகுமுறையை விட இன்னும் அனுமதிக்கக்கூடியது.
  • கட்டடக்கலை முன்னேற்றம்: MoE-க்கு மாறுவது தொழில்நுட்ப நுட்பத்தையும் நிலையான அளவிடுதலில் ஒரு கவனத்தையும் குறிக்கிறது, இது பெருகிய முறையில் பெரிய மாடல்களுடன் தொடர்புடைய கணக்கீட்டுச் செலவின் முக்கியமான சவாலை எதிர்கொள்கிறது.
  • எதிர்கால வேகம்: Behemoth-ஐ அறிவிப்பது எதிர்பார்ப்புகளை அமைக்கிறது மற்றும் எல்லைப்புற AI ஆராய்ச்சிக்கான நீண்டகால உறுதிப்பாட்டைக் குறிக்கிறது, இது செயற்கை பொது நுண்ணறிவின் (AGI) எதிர்காலப் பாதை பற்றிய விவாதங்களில் Meta-வைப் பொருத்தமாக வைத்திருக்கிறது.

ஏப்ரல் 29 ஆம் தேதி திட்டமிடப்பட்டுள்ள வரவிருக்கும் LlamaCon மாநாடு, Meta அதன் AI மூலோபாயத்தை மேலும் விவரிக்கவும், Llama 4 மாடல்களில் ஆழமான தொழில்நுட்ப ஆய்வுகளை வழங்கவும், Behemoth-இன் முன்னேற்றம் பற்றி மேலும் வெளிப்படுத்தவும், அதன் தொழில்நுட்பத்தைப் பயன்படுத்தி உருவாக்கப்பட்ட பயன்பாடுகளைக் காட்சிப்படுத்தவும் ஒரு முக்கிய இடமாக இருக்கும். இந்த பிரத்யேக நிகழ்வு Meta-வின் எதிர்காலத் திட்டங்களுக்கு Llama-வின் மையத்தன்மையை அடிக்கோடிட்டுக் காட்டுகிறது.

Llama 4-இன் வெளியீடு AI நிலப்பரப்பு முழுவதும் நம்பமுடியாத வேகமான கண்டுபிடிப்புகளின் பின்னணியில் நிகழ்கிறது. புதிய மாடல்கள் மற்றும் திறன்கள் அடிக்கடி அறிவிக்கப்படுகின்றன, மேலும் செயல்திறன் அளவுகோல்கள் தொடர்ந்து மீட்டமைக்கப்படுகின்றன. Meta-வின் Llama 4 வரைபடத்தில் செயல்படும் திறன், சுயாதீன சரிபார்ப்பு மூலம் அதன் செயல்திறன் கோரிக்கைகளை வழங்குதல் மற்றும் தொடர்ந்து புதுமைப்படுத்துதல் ஆகியவை இந்த மாறும் மற்றும் கடுமையாகப் போட்டி நிறைந்த துறையில் அதன் வேகத்தைத் தக்கவைக்க முக்கியமானதாக இருக்கும். தனியுரிம மேம்பாடு, சமூக ஈடுபாடு மற்றும் மூலோபாய உரிமம் ஆகியவற்றுக்கு இடையிலான இடைவினை, செயற்கை நுண்ணறிவின் உருமாறும் சகாப்தத்தில் Meta-வின் பங்கு மற்றும் செல்வாக்கைத் தொடர்ந்து வடிவமைக்கும்.