செயற்கை நுண்ணறிவு வளர்ச்சியின் இடைவிடாத வேகம் குறையாமல் தொடர்கிறது, முக்கிய தொழில்நுட்ப நிறுவனங்கள் மிகவும் சக்திவாய்ந்த, திறமையான மற்றும் பல்துறை மாடல்களை உருவாக்குவதில் மேலாதிக்கத்திற்காக போட்டியிடுகின்றன. இந்த கடுமையான போட்டிச் சூழலில், Meta அதன் Llama 4 தொடரை அறிவிப்பதன் மூலம் ஒரு புதிய சவாலை விடுத்துள்ளது. இது கலை நிலையை கணிசமாக முன்னேற்றுவதற்கும், டெவலப்பர் கருவிகள் முதல் நுகர்வோர் எதிர்கொள்ளும் உதவியாளர்கள் வரை பரந்த அளவிலான பயன்பாடுகளுக்கு சக்தி அளிப்பதற்கும் வடிவமைக்கப்பட்ட அடிப்படை AI மாடல்களின் தொகுப்பாகும். இந்த வெளியீடு Meta-வின் AI லட்சியங்களுக்கு ஒரு முக்கிய தருணத்தைக் குறிக்கிறது, உடனடியாகக் கிடைக்கும் இரண்டு தனித்துவமான மாடல்களை அறிமுகப்படுத்துகிறது, அதே நேரத்தில் தற்போது கடுமையான பயிற்சியில் இருக்கும் மூன்றாவது, சாத்தியமான புரட்சிகரமான பிரம்மாண்டமான மாடலைப் பற்றிய எதிர்பார்ப்பையும் தூண்டுகிறது. Llama 4 குடும்பம் ஒரு மூலோபாய பரிணாமத்தை பிரதிபலிக்கிறது, இது அதிநவீன கட்டடக்கலை தேர்வுகளை உள்ளடக்கியது மற்றும் OpenAI, Google மற்றும் Anthropic போன்ற போட்டியாளர்களால் அமைக்கப்பட்ட நிறுவப்பட்ட வரையறைகளை சவால் செய்வதை நோக்கமாகக் கொண்டுள்ளது. இந்த முயற்சி, திறந்த ஆராய்ச்சி சமூகத்திற்கு (சில எச்சரிக்கைகளுடன்) பங்களிப்பதன் மூலமும், இந்த மேம்பட்ட திறன்களை அதன் பரந்த சமூக ஊடகங்கள் மற்றும் தகவல் தொடர்பு தளங்களின் சுற்றுச்சூழல் அமைப்பில் நேரடியாக ஒருங்கிணைப்பதன் மூலமும் AI-யின் எதிர்காலத்தை வடிவமைப்பதில் Meta-வின் உறுதிப்பாட்டை அடிக்கோடிட்டுக் காட்டுகிறது.
Llama 4 Scout: ஒரு சிறிய தொகுப்பில் சக்தி
முன்னணியில் இருப்பது Llama 4 Scout, இது செயல்திறன் மற்றும் அணுகல்தன்மையை மையமாகக் கொண்டு வடிவமைக்கப்பட்ட ஒரு மாடல் ஆகும். Meta, Scout-ன் குறிப்பிடத்தக்க திறனை முன்னிலைப்படுத்துகிறது, இது ‘ஒற்றை Nvidia H100 GPU-வில் பொருந்தும்’ அளவுக்கு சிறியதாக இருக்கும்போது திறம்பட செயல்படுகிறது. இது ஒரு குறிப்பிடத்தக்க தொழில்நுட்ப சாதனை மற்றும் ஒரு மூலோபாய நன்மை. கணினி வளங்கள், குறிப்பாக H100 போன்ற உயர்நிலை GPU-க்கள் விலை உயர்ந்ததாகவும் அதிக தேவையிலும் இருக்கும் ஒரு சகாப்தத்தில், ஒரு ஒற்றை யூனிட்டில் இயங்கக்கூடிய ஒரு சக்திவாய்ந்த மாடல், டெவலப்பர்கள், ஆராய்ச்சியாளர்கள் மற்றும் சிறிய நிறுவனங்களுக்கான நுழைவுத் தடையை வியத்தகு முறையில் குறைக்கிறது. இது வள-கட்டுப்படுத்தப்பட்ட சூழல்களில் அதிநவீன AI திறன்களைப் பயன்படுத்துவதற்கான சாத்தியக்கூறுகளைத் திறக்கிறது, மேலும் உள்ளூர்மயமாக்கப்பட்ட அல்லது சாதனத்தில் AI செயலாக்கத்தை சாத்தியமாக்குகிறது, தாமதத்தைக் குறைக்கிறது மற்றும் தனியுரிமையை மேம்படுத்துகிறது.
Meta அதன் போட்டியாளர்களுக்கு எதிராக Scout-ஐ நிலைநிறுத்துவதில் தயக்கம் காட்டவில்லை. Google-ன் Gemma 3 மற்றும் Gemini 2.0 Flash-Lite, அத்துடன் பரவலாக மதிக்கப்படும் திறந்த மூல Mistral 3.1 மாடல் உட்பட, அதன் எடை வகுப்பில் உள்ள பல குறிப்பிடத்தக்க மாடல்களை Scout மிஞ்சுகிறது என்று நிறுவனம் கூறுகிறது. இந்த கூற்றுகள் ‘பரவலாக அறிவிக்கப்பட்ட வரையறைகளின் பரந்த வரம்பில்’ செயல்திறனை அடிப்படையாகக் கொண்டவை. வரையறை முடிவுகள் எப்போதும் கவனமாக ஆராயப்பட வேண்டும் என்றாலும் - அவை நிஜ உலக செயல்திறனின் அனைத்து அம்சங்களையும் பிடிக்காமல் போகலாம் - நிறுவப்பட்ட மாடல்களை தொடர்ந்து விஞ்சுவது Scout சக்தி மற்றும் செயல்திறனின் கட்டாய சமநிலையைக் கொண்டுள்ளது என்பதைக் குறிக்கிறது. இந்த வரையறைகள் பொதுவாக மொழி புரிதல், பகுத்தறிவு, கணித சிக்கல் தீர்க்கும் மற்றும் குறியீடு உருவாக்கம் போன்ற திறன்களை மதிப்பீடு செய்கின்றன. பலதரப்பட்ட வரையறைகளில் சிறந்து விளங்குவது Scout ஒரு முக்கிய மாடல் அல்ல, ஆனால் பல்வேறு பணிகளை திறம்பட கையாளக்கூடிய ஒரு பல்துறை கருவி என்பதைக் குறிக்கிறது.
மேலும், Llama 4 Scout ஒரு ஈர்க்கக்கூடிய 10-மில்லியன்-டோக்கன் சூழல் சாளரத்தை கொண்டுள்ளது. சூழல் சாளரம் என்பது ஒரு உரையாடல் அல்லது பணியின் போது ஒரு AI மாடல் ‘நினைவில் கொள்ள’ அல்லது கருத்தில் கொள்ளக்கூடிய தகவலின் அளவை வரையறுக்கிறது. ஒரு பெரிய சூழல் சாளரம், நீண்ட தொடர்புகளில் ஒத்திசைவைப் பேணவும், சிக்கலான ஆவணங்களைப் புரிந்துகொள்ளவும், சிக்கலான வழிமுறைகளைப் பின்பற்றவும், உள்ளீட்டின் முந்தைய பகுதியிலிருந்து விவரங்களை நினைவுபடுத்தவும் மாடலை அனுமதிக்கிறது. 10-மில்லியன்-டோக்கன் திறன் கணிசமானது, நீண்ட அறிக்கைகளைச் சுருக்குதல், விரிவான குறியீடு தளங்களை பகுப்பாய்வு செய்தல் அல்லது கதையின் இழையை இழக்காமல் நீடித்த, பல-முறை உரையாடல்களில் ஈடுபடுதல் போன்ற பயன்பாடுகளை செயல்படுத்துகிறது. இந்த அம்சம் சிக்கலான, தகவல்-தீவிர பணிகளுக்கான Scout-ன் பயன்பாட்டை கணிசமாக மேம்படுத்துகிறது, இது ஒரு இலகுரக மாற்றீட்டை விட மிக அதிகம். ஒற்றை-GPU இணக்கத்தன்மை மற்றும் ஒரு பெரிய சூழல் சாளரத்தின் கலவையானது, பெரிய உள்கட்டமைப்பு முதலீடுகள் தேவையில்லாமல் சக்திவாய்ந்த AI-ஐத் தேடும் டெவலப்பர்களுக்கு Scout-ஐ குறிப்பாக புதிரான சலுகையாக ஆக்குகிறது.
Maverick: பிரதான போட்டியாளர்
ஆரம்ப Llama 4 வெளியீட்டில் மிகவும் சக்திவாய்ந்த உடன்பிறப்பாக நிலைநிறுத்தப்பட்டுள்ளது Llama 4 Maverick. இந்த மாடல் AI உலகின் கனரக எடையாளர்களுடன் நேரடியாக போட்டியிட வடிவமைக்கப்பட்டுள்ளது, OpenAI-ன் GPT-4o மற்றும் Google-ன் Gemini 2.0 Flash போன்ற வலிமையான மாடல்களுடன் ஒப்பிடப்படுகிறது. Maverick, பெரிய அளவிலான, உயர் செயல்திறன் கொண்ட AI துறையில் தலைமைத்துவத்திற்கான Meta-வின் முயற்சியைக் குறிக்கிறது, இது மிகவும் கோரும் உருவாக்கும் AI பணிகளைக் கையாளக்கூடிய திறன்களை வழங்குவதை நோக்கமாகக் கொண்டுள்ளது. இது Meta AI உதவியாளருக்குள் மிகவும் அதிநவீன அம்சங்களுக்கு சக்தி அளிக்க உத்தேசிக்கப்பட்ட இயந்திரமாகும், இது இப்போது இணையம் முழுவதும் அணுகக்கூடியது மற்றும் நிறுவனத்தின் முக்கிய தகவல் தொடர்பு பயன்பாடுகளான WhatsApp, Messenger மற்றும் Instagram Direct ஆகியவற்றில் ஒருங்கிணைக்கப்பட்டுள்ளது.
Meta அதன் முதன்மை போட்டியாளர்களுக்கு எதிராக அதன் செயல்திறனை சாதகமாக ஒப்பிடுவதன் மூலம் Maverick-ன் திறமையை வலியுறுத்துகிறது. GPT-4o மற்றும் Gemini 2.0 Flash-ன் திறன்களுக்கு எதிராக Maverick தன்னை நிலைநிறுத்துகிறது, மேலும் சில சூழ்நிலைகளில் சாத்தியமான முறையில் மிஞ்சுகிறது என்று நிறுவனம் கூறுகிறது. இந்த ஒப்பீடுகள் முக்கியமானவை, ஏனெனில் GPT-4o மற்றும் Gemini குடும்பம் பரவலாகக் கிடைக்கும் AI மாடல்களின் அதிநவீனத்தைக் குறிக்கின்றன. இங்கு வெற்றி என்பது Maverick நுணுக்கமான மொழி உருவாக்கம், சிக்கலான பகுத்தறிவு, அதிநவீன சிக்கல் தீர்க்கும் திறன் மற்றும் சாத்தியமான பல-மாதிரி தொடர்புகளுக்கு (ஆரம்ப வெளியீடு உரை அடிப்படையிலான வரையறைகளில் பெரிதும் கவனம் செலுத்தினாலும்) திறன் கொண்டது என்பதைக் குறிக்கிறது.
சுவாரஸ்யமாக, Meta மற்ற உயர் செயல்திறன் கொண்ட மாடல்களுடன் ஒப்பிடும்போது Maverick-ன் செயல்திறனையும் எடுத்துக்காட்டுகிறது, குறிப்பாக குறியீட்டு முறை மற்றும் பகுத்தறிவு பணிகளின் களங்களில் DeepSeek-V3-ஐக் குறிப்பிடுகிறது. Maverick ‘பாதிக்கும் குறைவான செயலில் உள்ள அளவுருக்களைப்’ பயன்படுத்தும் போது ஒப்பிடக்கூடிய முடிவுகளை அடைகிறது என்று Meta கூறுகிறது. இந்த கூற்று மாடல் கட்டமைப்பு மற்றும் பயிற்சி நுட்பங்களில் குறிப்பிடத்தக்க முன்னேற்றங்களை சுட்டிக்காட்டுகிறது. அளவுருக்கள், தளர்வாகப் பேசினால், மாடல் அதன் அறிவைச் சேமிக்க பயிற்சியின் போது கற்கும் மாறிகள் ஆகும். ‘செயலில் உள்ள அளவுருக்கள்’ பெரும்பாலும் Mixture of Experts (MoE) போன்ற கட்டமைப்புகளுடன் தொடர்புடையது, அங்கு மொத்த அளவுருக்களின் ஒரு துணைக்குழு மட்டுமே எந்தவொரு உள்ளீட்டிற்கும் பயன்படுத்தப்படுகிறது. குறைவான செயலில் உள்ள அளவுருக்களுடன் ஒத்த செயல்திறனை அடைவது, Maverick கணக்கீட்டு ரீதியாக இயக்க மலிவானதாக (அனுமான செலவு) மற்றும் பெரிய செயலில் உள்ள அளவுரு எண்ணிக்கைகளைக் கொண்ட மாடல்களை விட வேகமானதாக இருக்கலாம் என்பதைக் குறிக்கிறது, இது ஒரு சிறந்த செயல்திறன்-per-watt அல்லது செயல்திறன்-per-dollar விகிதத்தை வழங்குகிறது. இந்த செயல்திறன் Meta செயல்படும் அளவில் AI-ஐப் பயன்படுத்துவதற்கு முக்கியமானது, அங்கு சிறிய மேம்பாடுகள் கூட கணிசமான செலவு சேமிப்பு மற்றும் மேம்பட்ட பயனர் அனுபவமாக மொழிபெயர்க்கலாம். Maverick, எனவே, உயர்நிலை செயல்திறன் மற்றும் செயல்பாட்டுத் திறன் ஆகியவற்றுக்கு இடையே ஒரு சமநிலையை ஏற்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது, இது கோரும் டெவலப்பர் பயன்பாடுகள் மற்றும் பில்லியன் கணக்கான பயனர்களுக்கு சேவை செய்யும் தயாரிப்புகளில் ஒருங்கிணைப்பதற்கு ஏற்றதாக அமைகிறது.
Behemoth: எதிர்பார்க்கப்படும் மாபெரும்
Scout மற்றும் Maverick இப்போது கிடைக்கும்போது, Meta இன்னும் பெரிய மற்றும் சாத்தியமான மிகவும் சக்திவாய்ந்த மாடலின் வளர்ச்சியை முன்கூட்டியே அறிவித்துள்ளது: Llama 4 Behemoth. பெயர் குறிப்பிடுவது போல, Behemoth AI நிலப்பரப்பில் ஒரு டைட்டனாகக் கருதப்படுகிறது. Meta தலைமை நிர்வாக அதிகாரி Mark Zuckerberg இந்த மாடலுக்கான லட்சியத்தை பகிரங்கமாக கூறியுள்ளார், அதன் பயிற்சி முடிந்ததும் இது ‘உலகின் மிக உயர்ந்த செயல்திறன் கொண்ட அடிப்படை மாடலாக’ இருக்கக்கூடும் என்று விவரித்தார். இது AI திறனின் முழுமையான எல்லைகளைத் தள்ளும் Meta-வின் நோக்கத்தைக் குறிக்கிறது.
Behemoth-ன் அளவு திகைக்க வைக்கிறது. இது 2 டிரில்லியன் மொத்த அளவுருக்களின் ஒரு பெரிய தொகுப்பிலிருந்து பெறப்பட்ட 288 பில்லியன் செயலில் உள்ள அளவுருக்களைக் கொண்டுள்ளது என்பதை Meta வெளிப்படுத்தியுள்ளது. இது முன்னோடியில்லாத அளவில் ஒரு அதிநவீன Mixture of Experts (MoE) கட்டமைப்பைப் பயன்படுத்துவதை வலுவாகக் குறிக்கிறது. மாடலின் முழுமையான அளவு, இது பரந்த தரவுத்தொகுப்புகளில் பயிற்சி அளிக்கப்படுகிறது மற்றும் நம்பமுடியாத சிக்கலான வடிவங்களையும் அறிவையும் கைப்பற்ற வடிவமைக்கப்பட்டுள்ளது என்பதைக் குறிக்கிறது. அத்தகைய ஒரு மாடலைப் பயிற்றுவிப்பது ஒரு மகத்தான முயற்சியாகும், இது மிகப்பெரிய கணினி வளங்களையும் நேரத்தையும் richiede, சாத்தியமான பலன் சமமாக குறிப்பிடத்தக்கது.
Behemoth இன்னும் வெளியிடப்படவில்லை என்றாலும், Meta ஏற்கனவே அதன் செயல்திறனுக்கான உயர் எதிர்பார்ப்புகளை அமைக்கிறது. தற்போதைய பயிற்சி மற்றும் மதிப்பீட்டின் அடிப்படையில், Behemoth, OpenAI-ன் எதிர்பார்க்கப்படும் GPT-4.5 மற்றும் Anthropic-ன் Claude Sonnet 3.7 போன்ற முன்னணி போட்டியாளர்களை, குறிப்பாக ‘பல STEM வரையறைகளில்’ விஞ்சும் திறனைக் காட்டுகிறது என்று நிறுவனம் கூறுகிறது. அறிவியல், தொழில்நுட்பம், பொறியியல் மற்றும் கணிதம் (STEM) வரையறைகளில் வெற்றி என்பது மேம்பட்ட பகுத்தறிவு மற்றும் சிக்கல் தீர்க்கும் திறன்களின் முக்கிய குறிகாட்டியாகக் காணப்படுகிறது. இந்தப் பகுதிகளில் சிறந்து விளங்கும் மாடல்கள் அறிவியல் ஆராய்ச்சியில் திருப்புமுனைகளைத் திறக்கலாம், பொறியியல் வடிவமைப்பு செயல்முறைகளை விரைவுபடுத்தலாம் மற்றும் தற்போது AI-யின் எல்லைக்கு அப்பாற்பட்ட சிக்கலான பகுப்பாய்வு சவால்களைச் சமாளிக்கலாம். STEM மீதான கவனம், Meta Behemoth-ஐ ஒரு மொழி மாடலாக மட்டுமல்லாமல், புதுமை மற்றும் கண்டுபிடிப்புக்கான சக்திவாய்ந்த இயந்திரமாகவும் பார்க்கிறது என்பதைக் குறிக்கிறது. Behemoth-ன் வளர்ச்சி Meta-வின் நீண்டகால மூலோபாயத்தை அடிக்கோடிட்டுக் காட்டுகிறது: மிக உயர்ந்த மட்டத்தில் போட்டியிடுவது மட்டுமல்லாமல், அடிப்படை AI மாடல்களுக்கான செயல்திறன் உச்சவரம்பை சாத்தியமான முறையில் மறுவரையறை செய்வது. அதன் இறுதி வெளியீடு முழு AI சமூகத்தாலும் உன்னிப்பாகக் கவனிக்கப்படும்.
திரைக்குப் பின்னால்: Mixture of Experts நன்மை
Llama 4 தொடருக்கு அடிப்படையான ஒரு முக்கிய தொழில்நுட்ப மாற்றம் Meta-வின் ‘mixture of experts’ (MoE) கட்டமைப்பை ஏற்றுக்கொள்வதாகும். இது ஒற்றைக்கல் மாடல் வடிவமைப்புகளிலிருந்து ஒரு குறிப்பிடத்தக்க பரிணாமத்தை பிரதிபலிக்கிறது, அங்கு முழு மாடலும் ஒவ்வொரு உள்ளீட்டையும் செயலாக்குகிறது. MoE, அனுமானத்தின் போது (மாடலைப் பயன்படுத்தி வெளியீட்டை உருவாக்கும் செயல்முறை) கணக்கீட்டு செலவில் விகிதாசார அதிகரிப்பு இல்லாமல் மிகப் பெரிய மற்றும் அதிக திறன் கொண்ட மாடல்களை உருவாக்குவதற்கான ஒரு பாதையை வழங்குகிறது.
ஒரு MoE மாடலில், அமைப்பு பல சிறிய, சிறப்பு வாய்ந்த ‘நிபுணர்’ நெட்வொர்க்குகளால் ஆனது. ஒரு உள்ளீடு (உரை வரியில் போன்றது) பெறப்படும்போது, ஒரு கேட்டிங் நெட்வொர்க் அல்லது ரூட்டர் பொறிமுறையானது உள்ளீட்டை பகுப்பாய்வு செய்து, அந்த குறிப்பிட்ட பணி அல்லது தகவல் வகையைக் கையாள எந்த நிபுணர்களின் துணைக்குழு மிகவும் பொருத்தமானது என்பதை தீர்மானிக்கிறது. இந்த தேர்ந்தெடுக்கப்பட்ட நிபுணர்கள் மட்டுமே உள்ளீட்டைச் செயலாக்க செயல்படுத்தப்படுகிறார்கள், மீதமுள்ளவர்கள் செயலற்ற நிலையில் ఉంటారు. இந்த நிபந்தனை கணக்கீடு MoE-யின் முக்கிய நன்மையாகும்.
நன்மைகள் இருமடங்கு:
- அளவிடுதல்: இது டெவலப்பர்களை ஒரு மாடலில் உள்ள மொத்த அளவுருக்களின் எண்ணிக்கையை (Behemoth-ல் உள்ள 2 டிரில்லியன் போன்றவை) வியத்தகு முறையில் அதிகரிக்க அனுமதிக்கிறது, ஏனெனில் அவற்றில் ஒரு பகுதி மட்டுமே (செயலில் உள்ள அளவுருக்கள், எ.கா., Behemoth-க்கு 288 பில்லியன்) எந்தவொரு ஒற்றை அனுமானத்திற்கும் ஈடுபடுத்தப்படுகிறது. இது மாடலை மிகப் பெரிய அளவிலான அறிவைச் சேமிக்கவும், அதன் நிபுணர் நெட்வொர்க்குகளுக்குள் மேலும் சிறப்பு வாய்ந்த செயல்பாடுகளைக் கற்றுக்கொள்ளவும் உதவுகிறது.
- செயல்திறன்: எந்த நேரத்திலும் மாடலின் ஒரு பகுதி மட்டுமே செயலில் இருப்பதால், அனுமானத்திற்குத் தேவைப்படும் கணக்கீட்டு செலவு மற்றும் ஆற்றல் நுகர்வு ஒத்த மொத்த அளவுரு அளவு கொண்ட அடர்த்தியான மாடலுடன் ஒப்பிடும்போது கணிசமாகக் குறைவாக இருக்கும். இது மிகப் பெரிய மாடல்களை இயக்குவதை மிகவும் நடைமுறை மற்றும் சிக்கனமானதாக ஆக்குகிறது, குறிப்பாக அளவில்.
Llama 4-க்கு MoE-க்கு மாறுவதை Meta வெளிப்படையாகக் குறிப்பிடுவது, Scout, Maverick மற்றும் குறிப்பாக பிரம்மாண்டமான Behemoth-க்கு நிர்ணயிக்கப்பட்ட செயல்திறன் மற்றும் செயல்திறன் இலக்குகளை அடைவதில் இந்தக் கட்டமைப்பு மையமானது என்பதைக் குறிக்கிறது. MoE கட்டமைப்புகள் அவற்றின் சொந்த சிக்கல்களை அறிமுகப்படுத்தினாலும், குறிப்பாக கேட்டிங் நெட்வொர்க்கை திறம்பட பயிற்றுவிப்பதிலும் நிபுணர்களிடையே தகவல்தொடர்புகளை நிர்வகிப்பதிலும், Meta போன்ற முக்கிய நிறுவனங்களால் அவற்றின் தத்தெடுப்பு AI வளர்ச்சியின் எல்லைகளைத் தள்ளுவதில் அவற்றின் வளர்ந்து வரும் முக்கியத்துவத்தைக் குறிக்கிறது. இந்த கட்டடக்கலைத் தேர்வு Maverick-ன் DeepSeek-V3-க்கு எதிரான செயல்திறன் மற்றும் Behemoth-க்கு எதிர்பார்க்கப்படும் முழுமையான அளவு ஆகியவற்றின் பின்னணியில் ஒரு முக்கிய காரணியாக இருக்கலாம்.
விநியோக உத்தி: திறந்த அணுகல் மற்றும் ஒருங்கிணைந்த அனுபவங்கள்
Meta அதன் Llama 4 மாடல்களின் பரவல் மற்றும் பயன்பாட்டிற்காக இரட்டை முனை உத்தியைப் பின்பற்றுகிறது, இது ஒரு பரந்த டெவலப்பர் சுற்றுச்சூழல் அமைப்பை வளர்ப்பதற்கும் அதன் சொந்த பாரிய பயனர் தளத்தைப் பயன்படுத்துவதற்கும் ஒரு விருப்பத்தை பிரதிபலிக்கிறது.
முதலாவதாக, Llama 4 Scout மற்றும் Llama 4 Maverick பதிவிறக்கத்திற்குக் கிடைக்கின்றன. டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்கள் Meta-விடமிருந்து நேரடியாக அல்லது இயந்திர கற்றல் சமூகத்திற்கான மைய மையமான Hugging Face போன்ற பிரபலமான தளங்கள் மூலம் மாடல்களைப் பெறலாம். இந்த அணுகுமுறை பரிசோதனையை ஊக்குவிக்கிறது, வெளிப்புற தரப்பினர் Llama 4-ன் மேல் பயன்பாடுகளை உருவாக்க அனுமதிக்கிறது, மேலும் மாடல்களின் திறன்களின் சுயாதீனமான ஆய்வு மற்றும் சரிபார்ப்பை எளிதாக்குகிறது. மாடல்களைப் பதிவிறக்குவதற்கு வழங்குவதன் மூலம், Meta பரந்த AI நிலப்பரப்பிற்கு பங்களிக்கிறது, அதன் சொந்த தயாரிப்புக் குழுக்களுக்கு அப்பால் புதுமைகளை செயல்படுத்துகிறது. இது, குறைந்தபட்சம் பகுதியளவு, துறையில் வரலாற்று ரீதியாக முன்னேற்றத்தை விரைவுபடுத்திய திறந்த ஆராய்ச்சி மற்றும் மேம்பாட்டின் நெறிமுறைகளுடன் ஒத்துப்போகிறது.
இரண்டாவதாக, மற்றும் ஒரே நேரத்தில், Meta Llama 4-ன் திறன்களை அதன் சொந்த தயாரிப்புகளில் ஆழமாக ஒருங்கிணைக்கிறது. இந்த புதிய மாடல்களால் இயக்கப்படும் Meta AI உதவியாளர், நிறுவனத்தின் இணைய இருப்பு முழுவதும் மற்றும், ஒருவேளை மிக முக்கியமாக, அதன் பரவலாகப் பயன்படுத்தப்படும் தகவல் தொடர்பு பயன்பாடுகளான WhatsApp, Messenger மற்றும் Instagram Direct ஆகியவற்றில் வெளியிடப்படுகிறது. இது உடனடியாக மேம்பட்ட AI கருவிகளை உலகளவில் பில்லியன் கணக்கான பயனர்களின் கைகளில் வைக்கிறது. இந்த ஒருங்கிணைப்பு பல மூலோபாய நோக்கங்களுக்கு உதவுகிறது: இது Meta-வின் தளங்களின் பயனர்களுக்கு உடனடி மதிப்பை வழங்குகிறது, பரந்த அளவிலான நிஜ உலக தொடர்புத் தரவை உருவாக்குகிறது (இது தனியுரிமைக் கருத்தாய்வுகளுக்கு உட்பட்டு, மேலும் மாடல் சுத்திகரிப்புக்கு விலைமதிப்பற்றதாக இருக்கலாம்), மற்றும் Meta-வின் பயன்பாடுகளை AI நுண்ணறிவுடன் உட்செலுத்தப்பட்ட அதிநவீன தளங்களாக நிலைநிறுத்துகிறது. இது ஒரு சக்திவாய்ந்த பின்னூட்ட வளையத்தை உருவாக்குகிறது மற்றும் Meta அதன் முக்கிய சேவைகளை மேம்படுத்துவதன் மூலம் அதன் சொந்த AI முன்னேற்றங்களிலிருந்து நேரடியாக பயனடைவதை உறுதி செய்கிறது.
இந்த இரட்டை உத்தி சில போட்டியாளர்களால் எடுக்கப்பட்ட அணுகுமுறைகளுடன் முரண்படுகிறது. OpenAI முதன்மையாக API-கள் மூலம் அணுகலை வழங்கும்போது (GPT-4 க்குப் போல) மற்றும் Google அதன் சேவைகளில் Gemini-ஐ ஆழமாக ஒருங்கிணைத்து API அணுகலையும் வழங்கும்போது, Meta மாடல்களையே பதிவிறக்கம் செய்யக் கிடைக்கச் செய்வதில் (உரிம நிபந்தனைகளுடன்) அதன் முக்கியத்துவம், டெவலப்பர் சமூகம் மற்றும் இறுதிப் பயனர் சந்தை ஆகிய இரண்டிலும் மனதைப் பிடிப்பதற்கான ஒரு தனித்துவமான அணுகுமுறையைக் குறிக்கிறது.
திறந்த மூல கேள்வி: ஒரு உரிம புதிர்
Meta அதன் Llama மாடல் வெளியீடுகளை, Llama 4 உட்பட, தொடர்ந்து ‘திறந்த-மூலம்’ என்று குறிப்பிடுகிறது. இருப்பினும், இந்த பதவி தொழில்நுட்ப சமூகத்திற்குள் ஒரு தொடர்ச்சியான சர்ச்சைக்குரிய புள்ளியாக இருந்து வருகிறது, முதன்மையாக Llama உரிமத்தின் குறிப்பிட்ட விதிமுறைகள் காரணமாக. மாடல்கள் மற்றவர்கள் பயன்படுத்தவும் மாற்றவும் கிடைக்கச் செய்யப்பட்டாலும், உரிமம் சில கட்டுப்பாடுகளை விதிக்கிறது, அவை Open Source Initiative (OSI) போன்ற அமைப்புகளால் ஆதரிக்கப்படும் திறந்த மூலத்தின் நிலையான வரையறைகளிலிருந்து விலகுகின்றன.
மிக முக்கியமான கட்டுப்பாடு பெரிய அளவிலான வணிக பயன்பாடு தொடர்பானது. Llama 4 உரிமம், 700 மில்லியனுக்கும் அதிகமான மாதாந்திர செயலில் உள்ள பயனர்களை (MAU) பெருமைப்படுத்தும் வணிக நிறுவனங்கள் Llama 4 மாடல்களைப் பயன்படுத்துவதற்கு அல்லது பயன்படுத்துவதற்கு முன்பு Meta-விடமிருந்து வெளிப்படையான அனுமதியைப் பெற வேண்டும் என்று குறிப்பிடுகிறது. இந்த வரம்பு திறம்பட மிகப்பெரிய தொழில்நுட்ப நிறுவனங்களை - Meta-வின் சாத்தியமான நேரடி போட்டியாளர்களை - Meta-வின் அனுமதியின்றி தங்கள் சொந்த சேவைகளை மேம்படுத்த Llama 4-ஐ சுதந்திரமாகப் பயன்படுத்துவதைத் தடுக்கிறது.
இந்தக் கட்டுப்பாடு, திறந்த மூலக் கொள்கைகளின் பரவலாக அங்கீகரிக்கப்பட்ட பாதுகாவலரான Open Source Initiative, முன்னர் (இதே போன்ற விதிமுறைகளைக் கொண்ட Llama 2 தொடர்பாக) அத்தகைய நிபந்தனைகள் உரிமத்தை ‘திறந்த மூல’ வகையிலிருந்து வெளியேற்றுகின்றன என்று கூற வழிவகுத்தது. உண்மையான திறந்த மூல உரிமங்கள், OSI வரையறையின்படி, முயற்சித் துறைகள் அல்லது குறிப்பிட்ட நபர்கள் அல்லது குழுக்களுக்கு எதிராக பாகுபாடு காட்டக்கூடாது, மேலும் அவை பொதுவாக பயனரின் அளவு அல்லது சந்தை நிலையின் அடிப்படையில் சிறப்பு அனுமதி தேவையில்லாமல் பரந்த வணிக பயன்பாட்டை அனுமதிக்கின்றன.
Meta-வின் அணுகுமுறையை முற்றிலும் திறந்த மூலத்தை விட ‘மூல-கிடைக்கும்’ அல்லது ‘சமூக’ உரிமத்தின் ஒரு வடிவமாகக் காணலாம். இந்த உரிம உத்தியின் பின்னணியில் உள்ள பகுத்தறிவு பலதரப்பட்டதாக இருக்கலாம். இது சக்திவாய்ந்த மாடல்களுக்கான அணுகலை வழங்குவதன் மூலம் பரந்த டெவலப்பர் மற்றும் ஆராய்ச்சி சமூகங்களுக்குள் நல்லெண்ணத்தைப் பெறவும் புதுமைகளை வளர்க்கவும் Meta-வை அனுமதிக்கிறது. அதே நேரத்தில், இது Meta-வின் மூலோபாய நலன்களைப் பாதுகாக்கிறது, அதன் மிகப்பெரிய போட்டியாளர்கள் அதன் குறிப்பிடத்தக்க AI முதலீடுகளை நேரடியாக அதற்கு எதிராகப் பயன்படுத்துவதைத் தடுக்கிறது. இந்த நடைமுறை அணுகுமுறை Meta-வின் வணிக இலக்குகளுக்கு சேவை செய்யக்கூடும் என்றாலும், ‘திறந்த-மூலம்’ என்ற வார்த்தையின் பயன்பாடு சர்ச்சைக்குரியதாகவே உள்ளது, ஏனெனில் இது குழப்பத்தை உருவாக்கலாம் மற்றும் மென்பொருள் மேம்பாட்டு உலகில் சுதந்திரம் மற்றும் கட்டுப்பாடற்ற அணுகலின் குறிப்பிட்ட அர்த்தங்களைக் கொண்ட ஒரு வார்த்தையின் பொருளை நீர்த்துப்போகச் செய்யலாம். இந்தத் தொடர்ச்சியான விவாதம், செயற்கை நுண்ணறிவின் வேகமாக வளர்ந்து வரும் துறையில் திறந்த ஒத்துழைப்பு, பெருநிறுவன உத்தி மற்றும் அறிவுசார் சொத்து ஆகியவற்றின் சிக்கலான குறுக்குவெட்டை எடுத்துக்காட்டுகிறது.
Meta அதன் AI வரைபடம் பற்றிய கூடுதல் விவரங்களைப் பகிர்ந்து கொள்ளவும், ஏப்ரல் 29 ஆம் தேதி திட்டமிடப்பட்டுள்ள அதன் வரவிருக்கும் LlamaCon மாநாட்டில் சமூகத்துடன் ஈடுபடவும் திட்டமிட்டுள்ளது. இந்த நிகழ்வு Llama 4-ன் தொழில்நுட்ப அடிப்படைகள், சாத்தியமான எதிர்கால மறு செய்கைகள் மற்றும் அதன் சுற்றுச்சூழல் அமைப்பு மற்றும் அதற்கு அப்பால் AI-யின் பங்கு குறித்த நிறுவனத்தின் பரந்த பார்வை பற்றிய கூடுதல் நுண்ணறிவுகளை வழங்கும். Llama 4 Scout மற்றும் Maverick-ன் வெளியீடு, Behemoth-ன் வாக்குறுதியுடன் சேர்ந்து, தொழில்நுட்ப கண்டுபிடிப்பு மற்றும் மூலோபாய பரவல் ஆகிய இரண்டின் மூலமும் அதன் பாதையை வடிவமைத்து, AI புரட்சியில் ஒரு முன்னணி சக்தியாக இருக்க Meta-வின் உறுதியை தெளிவாகக் குறிக்கிறது.