செயற்கை நுண்ணறிவின் (AI) இடைவிடாத முன்னேற்றத் துறையில், Meta மீண்டும் கவனத்தை ஈர்த்துள்ளது, அதன் சமீபத்திய மற்றும் மிகவும் அதிநவீன AI மாடல்களின் தொகுப்பான Llama 4-ன் வருகையை அறிவித்துள்ளது. இந்த வளர்ச்சி ஒருங்கிணைந்த Meta AI உதவியாளருக்கு ஒரு குறிப்பிடத்தக்க மேம்படுத்தலைக் குறிக்கிறது, பயனர்களுக்கு நிறுவனத்தின் பரந்த டிஜிட்டல் தளங்களில் கணிசமாக மேம்படுத்தப்பட்ட ஊடாடும் அனுபவத்தை உறுதியளிக்கிறது. இந்த புதிய மாடல்கள் இப்போது Meta AI உதவியாளரை இயக்கும் இயந்திரம் என்பதை தொழில்நுட்ப நிறுவனம் உறுதிப்படுத்தியது, மேம்பட்ட திறன்களை இணையத்தில் மட்டுமல்லாமல், அதன் முக்கிய தகவல் தொடர்பு தளங்களான WhatsApp, Messenger மற்றும் Instagram ஆகியவற்றின் கட்டமைப்பிலும் ஆழமாக ஒருங்கிணைக்கிறது. இந்த மூலோபாய வரிசைப்படுத்தல், பில்லியன் கணக்கானவர்களின் அன்றாட டிஜிட்டல் வாழ்க்கையில் அதிநவீன AI-ஐ தடையின்றி உட்பொதிப்பதற்கான Meta-வின் உறுதிப்பாட்டை அடிக்கோடிட்டுக் காட்டுகிறது.
Meta கட்டமைப்பில் நுண்ணறிவை நெய்தல்
Llama 4-ன் ஒருங்கிணைப்பு ஒரு கூடுதல் மேம்படுத்தலை விட மேலானது; இது Meta-வின் பல்வேறு பயன்பாட்டுத் தொகுப்புகளில் பயனர் அனுபவத்தை ஒன்றிணைத்து உயர்த்துவதற்கான ஒரு மூலோபாய நடவடிக்கையைக் குறிக்கிறது. Meta AI உதவியாளரை ஒரு நிலையான, சக்திவாய்ந்த அடித்தளத்துடன் இயக்குவதன் மூலம், ஒரு பயனர் WhatsApp-ல் செய்தி அனுப்பினாலும், Instagram-ல் ஸ்க்ரோல் செய்தாலும் அல்லது இணையத்தில் உலாவினாலும், மிகவும் ஒத்திசைவான, திறமையான மற்றும் சூழல் சார்ந்த விழிப்புணர்வுள்ள தொடர்புகளை வழங்க நிறுவனம் நோக்கமாகக் கொண்டுள்ளது.
ஒரு Messenger அரட்டையில் Meta AI உதவியாளரிடம் தகவல்களைக் கேட்பதை கற்பனை செய்து பாருங்கள். Llama 4 உடன், உதவியாளர் உரையாடலின் சூழலைப் பற்றிய மிகவும் ஆழமான புரிதலைப் பெறலாம், தகவல்களை மிகவும் திறமையாக அணுகலாம் மற்றும் செயலாக்கலாம், மேலும் துல்லியமானவை மட்டுமல்லாமல், மிகவும் நுணுக்கமான மற்றும் ஈர்க்கக்கூடிய பதில்களை உருவாக்கலாம். இதேபோல், Instagram-க்குள், AI மிகவும் அதிநவீன உள்ளடக்கப் பரிந்துரைகளை வழங்கலாம், ஆக்கப்பூர்வமான தலைப்புகளை உருவாக்கலாம் அல்லது புதுமையான வழிகளில் காட்சித் தேடல் வினவல்களுக்கு உதவலாம். WhatsApp-ல், அதன் இருப்பு தகவல்தொடர்புகளை நெறிப்படுத்தலாம், நீண்ட குழு அரட்டைகளை சுருக்கலாம் அல்லது அதிக சரளத்துடன் செய்திகளை வரையலாம். இணைய இடைமுகம், மிகவும் பொதுவான அணுகல் புள்ளியாக செயல்படுகிறது, அடிப்படை Llama 4 கட்டமைப்பின் மூல சக்தி மற்றும் பல்துறைத்திறனிலிருந்து பயனடைகிறது, சிக்கலான சிக்கல் தீர்த்தல், உள்ளடக்க உருவாக்கம் மற்றும் தகவல் தொகுப்பு ஆகியவற்றை செயல்படுத்துகிறது.
இந்த குறுக்கு-தள உத்தி Meta-விற்கு முக்கியமானது. இது நிறுவனத்தின் பரந்த அணுகலைப் பயன்படுத்தி அதன் சமீபத்திய AI கண்டுபிடிப்புகளை நேரடியாக இறுதிப் பயனர்களுக்கு வரிசைப்படுத்துகிறது, மேலும் செம்மைப்படுத்துதலுக்கான சக்திவாய்ந்த பின்னூட்ட வளையத்தை உருவாக்குகிறது. மேலும், இது Meta AI உதவியாளரை ஒரு தனித்த கருவியாக மட்டுமல்லாமல், பயனரின் டிஜிட்டல் தொடர்புகள் முழுவதும் நெய்யப்பட்ட ஒரு அறிவார்ந்த அடுக்காக நிலைநிறுத்துகிறது, இது அனைத்து தளங்களிலும் ஈடுபாடு மற்றும் பயன்பாட்டை அதிகரிக்கக்கூடும். இந்த ஒருங்கிணைப்பின் வெற்றி Llama 4 மாடல்களின் செயல்திறன் மற்றும் செயல்திறனைப் பொறுத்தது.
திறன்களின் ஒரு ஸ்பெக்ட்ரம்: Scout மற்றும் Maverick அறிமுகம்
வெவ்வேறு பயன்பாடுகளுக்கு சக்தி, செயல்திறன் மற்றும் செலவு ஆகியவற்றின் வெவ்வேறு சமநிலைகள் தேவை என்பதை உணர்ந்து, Meta ஆரம்பத்தில் Llama 4 குடும்பத்தில் இரண்டு தனித்துவமான மாடல்களை அறிமுகப்படுத்தியுள்ளது: Llama 4 Scout மற்றும் Llama 4 Maverick. இந்த அடுக்கு அணுகுமுறை குறிப்பிட்ட தேவைகள் மற்றும் வன்பொருள் கட்டுப்பாடுகளின் அடிப்படையில் உகந்த வரிசைப்படுத்தலை அனுமதிக்கிறது.
Llama 4 Scout: இந்த மாடல் செயல்திறனுக்காக வடிவமைக்கப்பட்டுள்ளது. Meta அதன் குறிப்பிடத்தக்க திறனை முன்னிலைப்படுத்துகிறது, இது ஒற்றை Nvidia H100 GPU-க்குள் பொருந்தும் அளவுக்கு சிறியதாக இருக்கும்போது திறம்பட செயல்படுகிறது. இது ஒரு குறிப்பிடத்தக்க தொழில்நுட்ப சாதனையாகும், இது கணிசமான AI சக்தியை ஒப்பீட்டளவில் மிதமான (ஹைப்பர்ஸ்கேலர் சூழலில்) வன்பொருள் வளங்களுடன் வரிசைப்படுத்த அனுமதிக்கும் மேம்படுத்தல்களை பரிந்துரைக்கிறது. அதன் சிறிய தடம் இருந்தபோதிலும், Scout அதன் வகுப்பில் ஒரு வலிமையான போட்டியாளராக வழங்கப்படுகிறது. Google-ன் Gemma 3 மற்றும் Gemini 2.0 Flash-Lite மாடல்கள், அத்துடன் பிரபலமான திறந்த மூல Mistral 3.1 மாடல் உட்பட பல குறிப்பிடத்தக்க போட்டியாளர்களை இது பல்வேறு நிலையான தொழில் தர அளவீடுகளில் மிஞ்சுகிறது என்று Meta வலியுறுத்துகிறது. இந்த செயல்திறன், அதன் செயல்திறனுடன் இணைந்து, Scout-ஐ விரைவான பதில்கள், குறைந்த செயல்பாட்டு செலவுகள் அல்லது கணக்கீட்டு வளங்கள் முதன்மைக் கருத்தாக இருக்கும் சூழல்களில் வரிசைப்படுத்துவதற்கு சாத்தியமானதாக ஆக்குகிறது. அதன் வடிவமைப்பு மிகப்பெரிய மாடல்களின் பெரும் மேல்நிலைச் செலவு இல்லாமல் வலுவான அடிப்படை செயல்திறனை வழங்குவதற்கு முன்னுரிமை அளிக்கிறது.
Llama 4 Maverick: மிகவும் சக்திவாய்ந்த சகாவாக நிலைநிறுத்தப்பட்டுள்ளது, Maverick OpenAI-ன் GPT-4o மற்றும் Google-ன் Gemini 2.0 Flash போன்ற முன்னணி பெரிய மொழி மாடல்களுக்கு மிகவும் ஒத்ததாக விவரிக்கப்படுகிறது. இந்த ஒப்பீடு Maverick மிகவும் சிக்கலான பணிகளைக் கையாளவும், ஆழமான பகுத்தறிவு திறன்களை வெளிப்படுத்தவும், மேலும் அதிநவீன மற்றும் ஆக்கப்பூர்வமான வெளியீடுகளை உருவாக்கவும் வடிவமைக்கப்பட்டுள்ளது என்பதைக் குறிக்கிறது. இது Scout உடன் ஒப்பிடும்போது அளவுரு எண்ணிக்கை மற்றும் கணக்கீட்டுத் தேவைகளில் குறிப்பிடத்தக்க படியை பிரதிநிதிநிதிக்கிறது. Maverick, Meta AI உதவியாளருக்கு ஒதுக்கப்பட்ட மிகவும் கோரும் வினவல்கள் மற்றும் ஆக்கப்பூர்வமான பணிகளுக்குப் பின்னால் உள்ள சாத்தியமான இயந்திரமாக இருக்கும், இது சிக்கலான மொழி புரிதல், உருவாக்கம் மற்றும் சிக்கல் தீர்த்தலுக்கான அதிநவீனத்திற்கு நெருக்கமான செயல்திறனை வழங்குகிறது. இது நுணுக்கமான புரிதல் மற்றும் உருவாக்கத் தரம் மிக முக்கியமான பயன்பாட்டு நிகழ்வுகளை குறிவைத்து, அதிக திறனை நோக்கிய உந்துதலை உள்ளடக்கியது.
இந்த இரட்டை-மாடல் உத்தி Meta-விற்கு நெகிழ்வுத்தன்மையை வழங்குகிறது. Scout அதிக அளவு, குறைவான சிக்கலான தொடர்புகளை திறமையாக கையாள முடியும், அதே நேரத்தில் Maverick அதிக அறிவாற்றல் குதிரைத்திறன் தேவைப்படும் பணிகளுக்கு அழைக்கப்படலாம். இந்த டைனமிக் ஒதுக்கீடு ஒவ்வொரு தொடர்புக்கும் மிகவும் சக்திவாய்ந்த மாடலை இயக்கும் செலவை ஏற்காமல் ஒரு பதிலளிக்கக்கூடிய மற்றும் திறமையான AI உதவியாளரை உறுதி செய்கிறது.
கட்டடக்கலை திருப்பம்: நிபுணர்களின் கலவையை (MoE) தழுவுதல்
Llama 4 குடும்பத்தை ஆதரிக்கும் ஒரு முக்கிய தொழில்நுட்ப கண்டுபிடிப்பு Meta-வின் “நிபுணர்களின் கலவை” (MoE - Mixture of Experts) கட்டமைப்பிற்கு வெளிப்படையான மாற்றமாகும். இது பாரம்பரிய “அடர்த்தியான” மாடல் கட்டமைப்புகளிலிருந்து ஒரு புறப்பாட்டைக் குறிக்கிறது, அங்கு மாடலின் ஒவ்வொரு பகுதியும் ஒவ்வொரு கணக்கீட்டிற்கும் செயல்படுத்தப்படுகிறது. MoE அணுகுமுறை மிகவும் வளம் சார்ந்த மாற்றீட்டை வழங்குகிறது.
ஒரு MoE மாடலில், கட்டமைப்பு பல சிறிய “நிபுணர்” துணை நெட்வொர்க்குகளைக் கொண்டுள்ளது, ஒவ்வொன்றும் வெவ்வேறு வகையான தரவு அல்லது பணிகளில் நிபுணத்துவம் பெற்றவை. ஒரு “கேட்டிங் நெட்வொர்க்” அல்லது “ரூட்டர்” பொறிமுறையானது உள்வரும் தரவை (தூண்டுதல் அல்லது வினவல்) பகுப்பாய்வு செய்து, அந்த குறிப்பிட்ட உள்ளீட்டைச் செயலாக்கத் தேவையான மிகவும் பொருத்தமான நிபுணர்(களு)க்கு மட்டுமே புத்திசாலித்தனமாக வழிநடத்துகிறது. உதாரணமாக, குறியீட்டு முறை பற்றிய ஒரு வினவல் நிரலாக்க மொழிகளில் பெரிதும் பயிற்சி பெற்ற நிபுணர்களுக்கு அனுப்பப்படலாம், அதே நேரத்தில் வரலாற்று நிகழ்வுகள் பற்றிய ஒரு கேள்வி வேறுபட்ட நிபுணர்களின் தொகுப்பை ஈடுபடுத்தலாம்.
இந்த கட்டமைப்பின் முதன்மை நன்மைகள் பின்வருமாறு:
- கணக்கீட்டுத் திறன்: மாடலின் மொத்த அளவுருக்களில் ஒரு பகுதி மட்டுமே எந்தவொரு குறிப்பிட்ட பணிக்கும் செயல்படுத்தப்படுவதால், அனுமானத்தின் போது (மாடல் ஒரு பதிலை உருவாக்கும் போது) கணக்கீட்டுச் செலவு சமமான அளவுரு எண்ணிக்கையின் அடர்த்தியான மாடலுடன் ஒப்பிடும்போது கணிசமாகக் குறைவாக இருக்கும். இது சாத்தியமான வேகமான மறுமொழி நேரங்கள் மற்றும் குறைக்கப்பட்ட ஆற்றல் நுகர்வுக்கு வழிவகுக்கிறது.
- அளவிடுதல்: MoE கட்டமைப்புகள், ஒரு அனுமானத்திற்கான கணக்கீட்டுச் செலவில் விகிதாசார அதிகரிப்பு இல்லாமல், மாடல்களை மிகப்பெரிய அளவுரு எண்ணிக்கைகளுக்கு அளவிட அனுமதிக்கின்றன. ஆராய்ச்சியாளர்கள் மாடலின் ஒட்டுமொத்த அறிவு மற்றும் திறனை அதிகரிக்க அதிக நிபுணர்களைச் சேர்க்கலாம், அதே நேரத்தில் கேட்டிங் நெட்வொர்க் அனுமானம் ஒப்பீட்டளவில் திறமையாக இருப்பதை உறுதி செய்கிறது.
- நிபுணத்துவம்: சிறப்பு நிபுணர்களுக்குப் பயிற்சி அளிப்பது குறிப்பிட்ட களங்களுக்கு உயர் தரமான வெளியீடுகளுக்கு வழிவகுக்கும், ஏனெனில் ஒவ்வொரு நிபுணரும் அதன் பகுதியில் ஆழ்ந்த தேர்ச்சியை வளர்த்துக் கொள்ள முடியும்.
இருப்பினும், MoE மாடல்கள் சிக்கல்களையும் அறிமுகப்படுத்துகின்றன. அவற்றை திறம்பட பயிற்றுவிப்பது மிகவும் சவாலானது, நிபுணர் பயன்பாட்டின் கவனமான சமநிலை மற்றும் அதிநவீன ரூட்டிங் வழிமுறைகள் தேவை. பல்வேறு பணிகளில் நிலையான செயல்திறனை உறுதி செய்வதும், கேட்டிங் நெட்வொர்க் உகந்த ரூட்டிங் முடிவுகளை எடுக்காத சூழ்நிலைகளைத் தவிர்ப்பதும் செயலில் உள்ள ஆராய்ச்சிப் பகுதிகளாகும்.
Llama 4-க்கான MoE-ஐ Meta ஏற்றுக்கொள்வது ஒரு பரந்த தொழில் போக்குடன் ஒத்துப்போகிறது, ஏனெனில் மற்ற முன்னணி AI ஆய்வகங்களும் மாடல் அளவு மற்றும் செயல்திறனின் எல்லைகளைத் தள்ள இதேபோன்ற கட்டமைப்புகளை ஆராய்ந்து வருகின்றன அல்லது வரிசைப்படுத்துகின்றன. இந்த கட்டடக்கலைத் தேர்வு, திறமையான Scout மற்றும் சக்திவாய்ந்த Maverick மாடல்களுக்குக் கூறப்படும் செயல்திறன் பண்புகளை அடைவதற்கு அடிப்படையானது. இது Meta-வை பெரிய, அதிக அறிவுள்ள மாடல்களை உருவாக்க அனுமதிக்கிறது, அதே நேரத்தில் அளவில் AI-ஐ இயக்குவதில் உள்ள கணக்கீட்டுத் தேவைகளை நிர்வகிக்கிறது.
சூழலைப் புரிந்துகொள்ளுதல்: 10 மில்லியன் டோக்கன் சாளரத்தின் முக்கியத்துவம்
Llama 4 Scout மாடலுக்காகக் குறிப்பிடப்பட்ட ஒரு தனித்துவமான விவரக்குறிப்பு அதன் 10-மில்லியன்-டோக்கன் சூழல் சாளரம் ஆகும். சூழல் சாளரம் என்பது பெரிய மொழி மாடல்களில் ஒரு முக்கியமான கருத்தாகும், இது அடிப்படையில் மாடலின் குறுகிய கால அல்லது வேலை நினைவகத்தைக் குறிக்கிறது. உள்ளீட்டைச் செயலாக்கும்போதும் வெளியீட்டை உருவாக்கும்போதும் மாடல் ஒரே நேரத்தில் கருத்தில் கொள்ளக்கூடிய தகவல்களின் அளவை (டோக்கன்களில் அளவிடப்படுகிறது, இது தோராயமாக சொற்கள் அல்லது சொற்களின் பகுதிகளுடன் தொடர்புடையது) இது வரையறுக்கிறது.
ஒரு பெரிய சூழல் சாளரம் நேரடியாக மேம்பட்ட திறன்களுக்கு வழிவகுக்கிறது:
- நீண்ட ஆவணங்களைக் கையாளுதல்: 10-மில்லியன்-டோக்கன் சாளரம், நீண்ட ஆய்வுக் கட்டுரைகள், சட்ட ஒப்பந்தங்கள், முழு புத்தகங்கள் அல்லது விரிவான குறியீடு தளங்கள் போன்ற மிக நீண்ட ஆவணங்களை உட்செலுத்தி பகுப்பாய்வு செய்ய மாடலை அனுமதிக்கிறது, உரையில் முன்னர் வழங்கப்பட்ட தகவல்களை இழக்காமல். கணிசமான அளவு மூலப் பொருட்களின் அடிப்படையில் சுருக்கம், பகுப்பாய்வு அல்லது கேள்வி-பதில் சம்பந்தப்பட்ட பணிகளுக்கு இது முக்கியமானது.
- நீட்டிக்கப்பட்ட உரையாடல்கள்: உரையாடல் AI பயன்பாடுகளில், ஒரு பெரிய சூழல் சாளரம் மாடலை நீண்ட உரையாடல்களில் ஒத்திசைவைப் பேணவும் விவரங்களை நினைவுபடுத்தவும் உதவுகிறது. பயனர்கள் AI முன்னர் விவாதிக்கப்பட்ட புள்ளிகளை “மறந்துவிடாமல்” அல்லது நிலையான நினைவூட்டல்கள் தேவைப்படாமல் மிகவும் இயல்பான, நீட்டிக்கப்பட்ட தொடர்புகளைக் கொண்டிருக்கலாம்.
- சிக்கலான சிக்கல் தீர்த்தல்: பல மூலங்களிலிருந்து தகவல்களைத் தொகுக்க அல்லது சிக்கலான, பல-படி வழிமுறைகளைப் பின்பற்ற வேண்டிய பணிகள் ஒரு பெரிய சூழல் சாளரத்திலிருந்து கணிசமாக பயனடைகின்றன, ஏனெனில் மாடல் புதிரின் அனைத்து தொடர்புடைய துண்டுகளையும் அதன் வேலை நினைவகத்தில் வைத்திருக்க முடியும்.
- மேம்பட்ட குறியீட்டு உதவி: டெவலப்பர்களுக்கு, ஒரு பெரிய சூழல் சாளரம் என்பது AI ஒரு பெரிய மென்பொருள் திட்டத்திற்குள் பரந்த கட்டமைப்பு மற்றும் சார்புகளைப் புரிந்து கொள்ள முடியும் என்பதாகும், இது மிகவும் துல்லியமான குறியீடு உருவாக்கம், பிழைத்திருத்த பரிந்துரைகள் மற்றும் மறுசீரமைப்பு திறன்களுக்கு வழிவகுக்கிறது.
தொழில்துறை முழுவதும் சூழல் சாளர அளவுகள் வேகமாக அதிகரித்து வரும் நிலையில், Scout போன்ற செயல்திறனுக்காக வடிவமைக்கப்பட்ட ஒரு மாடலுக்கான 10-மில்லியன்-டோக்கன் திறன் குறிப்பாக குறிப்பிடத்தக்கது. இது போன்ற பரந்த அளவிலான சூழலைச் செயலாக்குவதில் உள்ள கணக்கீட்டு சவால்களை நிர்வகிப்பதில் குறிப்பிடத்தக்க முன்னேற்றங்களை இது பரிந்துரைக்கிறது, இது மேம்பட்ட கவனம் செலுத்தும் வழிமுறைகள் அல்லது நினைவக கட்டமைப்புகள் போன்ற நுட்பங்களை உள்ளடக்கியிருக்கலாம். இந்த திறன் Scout திறம்பட கையாளக்கூடிய பணிகளின் வரம்பை வியத்தகு முறையில் விரிவுபடுத்துகிறது, வளம்-திறனுள்ள மாடல்களுடன் சாத்தியமானவற்றின் எல்லைகளைத் தள்ளுகிறது. Meta மூல சக்தியில் மட்டும் கவனம் செலுத்தவில்லை, தகவல்-தீவிர பணிகளுக்கான நடைமுறை பயன்பாட்டிலும் கவனம் செலுத்துகிறது என்பதைக் குறிக்கிறது.
போட்டி அரங்கில் வழிசெலுத்தல்: Llama 4-ன் பெஞ்ச்மார்க் நிலை
Meta-வின் அறிவிப்பு Llama 4-ஐ, குறிப்பாக Scout மாடலை, Google-ன் Gemma 3 மற்றும் Gemini 2.0 Flash-Lite, மற்றும் திறந்த மூல Mistral 3.1 போன்ற குறிப்பிட்ட போட்டியாளர்களுக்கு எதிராக சாதகமாக நிலைநிறுத்துகிறது. இந்த ஒப்பீடுகள் பொதுவாக “பரவலாக அறிவிக்கப்பட்ட பெஞ்ச்மார்க்குகளின் பரந்த வரம்பை” அடிப்படையாகக் கொண்டவை. AI பெஞ்ச்மார்க்குகள் என்பது பல்வேறு திறன்களில் மாடல் செயல்திறனை மதிப்பிடுவதற்கு வடிவமைக்கப்பட்ட தரப்படுத்தப்பட்ட சோதனைகள் ஆகும், அவை:
- பகுத்தறிவு: தருக்க கழித்தல், சிக்கல் தீர்த்தல், கணித பகுத்தறிவு.
- மொழி புரிதல்: வாசிப்பு புரிதல், உணர்வு பகுப்பாய்வு, கேள்வி பதில்.
- குறியீட்டு முறை: குறியீடு உருவாக்கம், பிழை கண்டறிதல், குறியீடு நிறைவு.
- அறிவு: பல்வேறு களங்களில் உள்ள உண்மைகளை நினைவுபடுத்துதல்.
- பாதுகாப்பு: பாதுகாப்பு வழிகாட்டுதல்களுடன் சீரமைப்பை மதிப்பிடுதல் மற்றும் தீங்கு விளைவிக்கும் உள்ளடக்கத்தை உருவாக்குவதற்கான எதிர்ப்பை மதிப்பிடுதல்.
இந்த பெஞ்ச்மார்க்குகளில் மேன்மையை கோருவது மிகவும் போட்டி நிறைந்த AI நிலப்பரப்பில் முன்னேற்றத்தை நிரூபிப்பதற்கான ஒரு முக்கிய அம்சமாகும். இது ஆராய்ச்சியாளர்கள், டெவலப்பர்கள் மற்றும் சாத்தியமான பயனர்களுக்கு புதிய மாடல்கள் குறிப்பிட்ட, அளவிடக்கூடிய வழிகளில் ஏற்கனவே உள்ள மாற்றுகளுடன் ஒப்பிடும்போது உறுதியான மேம்பாடுகளை வழங்குகின்றன என்பதைக் குறிக்கிறது. இருப்பினும், பெஞ்ச்மார்க் முடிவுகளை நுணுக்கத்துடன் விளக்குவது முக்கியம். பயன்படுத்தப்படும் குறிப்பிட்ட பெஞ்ச்மார்க் தொகுப்பு, மதிப்பீட்டு முறை மற்றும் சோதிக்கப்படும் குறிப்பிட்ட பணிகளைப் பொறுத்து செயல்திறன் மாறுபடலாம். எந்தவொரு ஒற்றை பெஞ்ச்மார்க்கும் ஒரு மாடலின் திறன்களின் முழுமையையோ அல்லது நிஜ உலக பயன்பாடுகளுக்கான அதன் பொருத்தத்தையோ பிடிக்காது.
Meta-வின் உத்தி வெவ்வேறு அடுக்குகளில் தீவிரமாக போட்டியிடுவதை உள்ளடக்கியதாகத் தெரிகிறது. Scout உடன், இது செயல்திறன்-கவனம் செலுத்தும் பிரிவை குறிவைக்கிறது, Google மற்றும் Mistral AI போன்ற முன்னணி திறந்த மூல பிளேயர்களிடமிருந்து ஒப்பிடக்கூடிய மாடல்களை மிஞ்சும் நோக்கம் கொண்டது. Maverick உடன், இது உயர் செயல்திறன் அரங்கில் நுழைகிறது, OpenAI மற்றும் Google-ன் முதன்மை சலுகைகளை சவால் செய்கிறது. இந்த பலமுனை அணுகுமுறை AI சந்தையின் சிக்கலான இயக்கவியலைப் பிரதிபலிக்கிறது, அங்கு வெவ்வேறு இடங்களுக்கு வெவ்வேறு மேம்படுத்தல்கள் தேவைப்படுகின்றன. போட்டியாளர்களை மிஞ்சும் போது ஒற்றை H100 GPU-ல் இயங்கும் Scout-ன் திறனை வலியுறுத்துவது, செயல்திறன்-ஒரு-வாட் அல்லது செயல்திறன்-ஒரு-டாலர் அளவீடுகளின் அடிப்படையில் ஒரு நேரடி சவாலாகும், இது அளவில் வரிசைப்படுத்துவதற்கு பெருகிய முறையில் முக்கியமான கருத்தாகும்.
வரவிருக்கும் மாபெரும் சக்தி: Llama 4 Behemoth-ஐ எதிர்பார்த்தல்
Scout மற்றும் Maverick-ன் உடனடி வெளியீட்டிற்கு அப்பால், Meta இன்னும் Llama 4 Behemoth-ஐ தீவிரமாகப் பயிற்றுவிப்பதாக கவர்ச்சிகரமாக வெளிப்படுத்தியுள்ளது. இந்த மாடல் எதிர்பார்ப்பில் மூழ்கியுள்ளது, Meta CEO MarkZuckerberg-ன் தைரியமான கூற்றால் தூண்டப்பட்டது, இது “உலகின் மிக உயர்ந்த செயல்திறன் கொண்ட அடிப்படை மாடலாக” இருக்க வேண்டும் என்று நோக்கமாகக் கொண்டுள்ளது. விவரங்கள் குறைவாகவே இருந்தாலும், “Behemoth” என்ற பெயரே மகத்தான அளவு மற்றும் திறனைக் கொண்ட ஒரு மாடலைக் குறிக்கிறது, இது Maverick-ஐ அளவு மற்றும் கணக்கீட்டுத் தேவைகளில் கணிசமாக மிஞ்சும்.
Behemoth-ன் வளர்ச்சி AI-ல் “அளவீட்டு விதிகள்” என்ற நிறுவப்பட்ட கொள்கையுடன் ஒத்துப்போகிறது, இது பயிற்சி காலத்தில் மாடல் அளவு, தரவுத்தொகுப்பு அளவு மற்றும் கணக்கீட்டு வளங்களை அதிகரிப்பது பொதுவாக மேம்பட்ட செயல்திறன் மற்றும் வெளிப்படும் திறன்களுக்கு வழிவகுக்கிறது என்று கூறுகிறது. Behemoth அநேகமாக AI ஆராய்ச்சியின் முழுமையான அதிநவீனத்தை நோக்கிய Meta-வின் உந்துதலைப் பிரதிநிதித்துவப்படுத்துகிறது, இது போட்டியாளர்களால் தற்போது கிடைக்கும் அல்லது உருவாக்கத்தில் உள்ள மிகப்பெரிய மற்றும் சக்திவாய்ந்த மாடல்களுக்குப் போட்டியாக அல்லது மிஞ்சுவதை நோக்கமாகக் கொண்டுள்ளது.
அத்தகைய மாடல் அநேகமாக இலக்கு வைக்கப்படும்:
- ஆராய்ச்சி எல்லைகளைத் தள்ளுதல்: புதிய AI நுட்பங்களை ஆராய்வதற்கும் தற்போதைய கட்டமைப்புகளின் வரம்புகளைப் புரிந்துகொள்வதற்கும் ஒரு தளமாக செயல்படுகிறது.
- பெரும் சவால்களை எதிர்கொள்ளுதல்: மிகவும் சிக்கலான அறிவியல் சிக்கல்களைத் தீர்ப்பது, மருத்துவம், பொருள் அறிவியல் அல்லது காலநிலை மாடலிங் போன்ற துறைகளில் முன்னேற்றங்களைத் தூண்டுதல்.
- எதிர்கால பயன்பாடுகளுக்கு சக்தி அளித்தல்: முன்னோடியில்லாத அளவிலான பகுத்தறிவு, படைப்பாற்றல் மற்றும் அறிவுத் தொகுப்பு தேவைப்படும் AI-உந்துதல் தயாரிப்புகள் மற்றும் சேவைகளின் முற்றிலும் புதிய வகைகளை செயல்படுத்துதல்.
Behemoth போன்ற ஒரு மாடலைப் பயிற்றுவிப்பது ஒரு மகத்தான பணியாகும், இதற்கு பரந்த கணக்கீட்டு வளங்கள் (அநேகமாக GPU-களின் பெரிய தொகுப்புகள் அல்லது சிறப்பு AI முடுக்கிகள்) மற்றும் பாரிய, கவனமாகத் தொகுக்கப்பட்ட தரவுத்தொகுப்புகள் தேவைப்படுகின்றன. அதன் இறுதி வெளியீடு அல்லது வரிசைப்படுத்தல் Meta-வின் AI பயணத்தில் மற்றொரு குறிப்பிடத்தக்க மைல்கல்லைக் குறிக்கும், இது அடிப்படை மாடல் வளர்ச்சியில் ஒரு முன்னணி சக்தியாக அதன் நிலையை உறுதிப்படுத்தும். Zuckerberg-ன் கூற்று ஒரு உயர் பட்டியை அமைக்கிறது, மூல AI செயல்திறனில் உலகளாவிய தலைமையை அடைவதற்கான Meta-வின் லட்சியத்தைக் குறிக்கிறது.
Llama சுற்றுச்சூழல் அமைப்பிற்கு ஒரு “புதிய சகாப்தத்தை” அறிவித்தல்
Llama 4 மாடல்களை “Llama சுற்றுச்சூழல் அமைப்பிற்கு ஒரு புதிய சகாப்தத்தின் தொடக்கத்தைக் குறிக்கிறது” என்று Meta-வின் விளக்கம் கருத்தில் கொள்ளத்தக்கது. இந்த அறிக்கை வெறும் கூடுதல் மேம்பாடுகளுக்கு அப்பாற்பட்ட ஒரு தரமான மாற்றத்தை பரிந்துரைக்கிறது. இந்த “புதிய சகாப்தத்தை” எது உருவாக்குகிறது? பல காரணிகள் பங்களிக்கக்கூடும்:
- கட்டடக்கலை முதிர்ச்சி (MoE): நிபுணர்களின் கலவை (Mixture of Experts) கட்டமைப்பை ஏற்றுக்கொள்வது ஒரு குறிப்பிடத்தக்க தொழில்நுட்ப படியைக் குறிக்கிறது, இது அதிக அளவு மற்றும் செயல்திறனை செயல்படுத்துகிறது, இது எதிர்கால Llama தலைமுறைகளுக்கான பாதையை வரையறுக்கக்கூடும்.
- செயல்திறன் பாய்ச்சல்: Scout மற்றும் Maverick மூலம் நிரூபிக்கப்பட்ட திறன்கள், மற்றும் Behemoth-ன் வாக்குறுதி, முந்தைய Llama மறு செய்கைகளுடன் ஒப்பிடும்போது கணிசமான செயல்திறன் பாய்ச்சலைக் குறிக்கின்றன, இது சுற்றுச்சூழல் அமைப்பை மிக உயர்ந்த மட்டங்களில் போட்டித்தன்மையடையச் செய்கிறது.
- ஆழமான ஒருங்கிணைப்பு: Meta-வின் முக்கிய தளங்களில் (WhatsApp, Instagram, Messenger, Web) தடையற்ற வரிசைப்படுத்தல் எங்கும் நிறைந்த AI உதவிக்கு ஒரு நகர்வைக் குறிக்கிறது, இது Llama-வின் சக்தியை பில்லியன் கணக்கான பயனர்களுக்கு எளிதில் அணுகக்கூடியதாக ஆக்குகிறது.
- அடுக்கு சலுகைகள்: Scout மற்றும் Maverick போன்ற தனித்துவமான மாடல்களின் அறிமுகம் வெவ்வேறு தேவைகளுக்கு ஏற்ப வடிவமைக்கப்பட்ட தீர்வுகளை வழங்குகிறது, டெவலப்பர்கள் மற்றும் உள் குழுக்களுக்கு Llama தொழில்நுட்பத்தின் பயன்பாடு மற்றும் அணுகலை விரிவுபடுத்துகிறது.
- தொடர்ச்சியான திறந்த தன்மை (சாத்தியமான): மூலத்தில் Llama 4-க்கு வெளிப்படையாகக் கூறப்படவில்லை என்றாலும், Llama குடும்பம் வரலாற்று ரீதியாக ஒரு வலுவான திறந்த மூல கூறுகளைக் கொண்டுள்ளது. இது தொடர்ந்தால், Llama 4 திறந்த மூல AI சமூகத்தை கணிசமாக உற்சாகப்படுத்தக்கூடும், Meta-வின் நேரடி கட்டுப்பாட்டிற்கு வெளியே புதுமைக்கான சக்திவாய்ந்த அடித்தளத்தை வழங்குகிறது. இது Meta-வின் அடிப்படைப் பணிகளை அடிப்படையாகக் கொண்ட டெவலப்பர்கள், ஆராய்ச்சியாளர்கள் மற்றும் ஸ்டார்ட்அப்களின் துடிப்பான சுற்றுச்சூழல் அமைப்பை வளர்க்கிறது.
இந்த “புதிய சகாப்தம்” அநேகமாக மேம்பட்ட செயல்திறன், கட்டடக்கலை நுட்பம், பரந்த வரிசைப்படுத்தல் மற்றும் திறந்த மூல சமூகத்துடன் சாத்தியமான தொடர்ச்சியான ஈடுபாடு ஆகியவற்றின் கலவையால் வகைப்படுத்தப்படுகிறது, இது Llama-வை Meta-வின் எதிர்கால மூலோபாயத்தின் மையத் தூணாகவும் உலகளாவிய AI நிலப்பரப்பில் ஒரு பெரிய சக்தியாகவும் உறுதிப்படுத்துகிறது.
அடிவானத்தைப் பார்த்தல்: LlamaCon மற்றும் வெளிவரும் வரைபடம்
தற்போதைய Llama 4 வெளியீடுகள் “Llama 4 தொகுப்பிற்கான ஆரம்பம் மட்டுமே” என்று Meta வெளிப்படையாகக் கூறியுள்ளது. ஏப்ரல் 29, 2025 அன்று திட்டமிடப்பட்டுள்ள வரவிருக்கும் LlamaCon மாநாட்டில் மேலும் நுண்ணறிவுகளும் முன்னேற்றங்களும் எதிர்பார்க்கப்படுகின்றன. இந்த பிரத்யேக நிகழ்வு Meta-விற்கு டெவலப்பர் மற்றும் ஆராய்ச்சி சமூகத்துடன் ஈடுபடவும், அதன் சமீபத்திய முன்னேற்றங்களைக் காட்சிப்படுத்தவும், அதன் எதிர்காலத் திட்டங்களை கோடிட்டுக் காட்டவும் ஒரு தளமாக செயல்படுகிறது.
LlamaCon-க்கான எதிர்பார்ப்புகள் அநேகமாக பின்வருவனவற்றை உள்ளடக்கும்:
- ஆழமான தொழில்நுட்ப ஆய்வுகள்: Llama 4 மாடல்களின் கட்டமைப்பு, பயிற்சி முறைகள் மற்றும் செயல்திறன் பண்புகள் பற்றிய விரிவான விளக்கக்காட்சிகள்.
- சாத்தியமான புதிய மாடல் வகைகள்: Llama 4 குடும்பத்திற்குள் கூடுதல் மாடல்களின் அறிவிப்புகள், ஒருவேளை குறிப்பிட்ட முறைகளுக்கு (பார்வை அல்லது குறியீடு போன்றவை) வடிவமைக்கப்பட்டவை அல்லது வெவ்வேறு செயல்திறன் புள்ளிகளுக்கு மேலும் உகந்ததாக்கப்பட்டவை.
- டெவலப்பர் கருவிகள் மற்றும் வளங்கள்: Llama 4-ஐப் பயன்படுத்தி பயன்பாடுகளை உருவாக்குவதை டெவலப்பர்களுக்கு எளிதாக்க வடிவமைக்கப்பட்ட புதிய கருவிகள், API-கள் அல்லது தளங்களின் வெளியீடு.
- பயன்பாட்டு நிகழ்வுகள் மற்றும் பயன்பாடுகள்: Llama 4 Meta-வில் உள்நாட்டில் எவ்வாறு பயன்படுத்தப்படுகிறது மற்றும் ஆரம்ப கூட்டாளர்களால் உருவாக்கப்பட்ட சாத்தியமான பயன்பாடுகளின் செயல்விளக்கங்கள்.
- எதிர்கால வரைபட விவாதம்: Llama சுற்றுச்சூழல் அமைப்பிற்கான Meta-வின் நீண்டகால பார்வை பற்றிய நுண்ணறிவுகள், Llama 5 அல்லது அடுத்தடுத்த தலைமுறைகளுக்கான திட்டங்கள் மற்றும் Meta-வின் ஒட்டுமொத்த தயாரிப்பு மூலோபாயத்தில் AI-ன் பங்கு உட்பட.
- Behemoth பற்றிய புதுப்பிப்புகள்: Llama 4 Behemoth மாடலின் முன்னேற்றம் மற்றும் திறன்கள் பற்றிய சாத்தியமான உறுதியான தகவல்கள்.
LlamaCon, Meta தனது AI தலைமைத்துவத்தைச் சுற்றியுள்ள கதையை உறுதிப்படுத்தவும், பரந்த சுற்றுச்சூழல் அமைப்பிற்குள் உற்சாகத்தை வளர்க்கவும் ஒரு முக்கிய தருணத்தைக் குறிக்கிறது. மாநாடு Llama 4 தொகுப்பின் முழு நோக்கத்தையும், Meta-வின் சொந்த தயாரிப்புகளுக்குள்ளும், பரந்த தொழில்நுட்ப நிலப்பரப்பிலும் செயற்கை நுண்ணறிவின் எதிர்காலத்தை வடிவமைப்பதற்கான அதன் லட்சியங்களையும் பற்றிய தெளிவான படத்தை வழங்கும். Scout மற்றும் Maverick-ன் ஆரம்ப வெளியீடு மேடையை அமைக்கிறது, ஆனால் Llama 4-ன் முழு தாக்கம் வரும் மாதங்கள் மற்றும் ஆண்டுகளில் தொடர்ந்து வெளிவரும்.