Meta வெளியிடுகிறது Llama 4: புதிய AI மாதிரிகள்

Facebook, Instagram, மற்றும் WhatsApp ஆகியவற்றின் பின்னணியில் உள்ள தொழில்நுட்ப நிறுவனமான Meta Platforms, அதன் Llama 4 தொடரை அறிமுகப்படுத்தியதன் மூலம் செயற்கை நுண்ணறிவுத் துறையில் தனது நிலையை கணிசமாக முன்னேற்றியுள்ளது. இந்த வெளியீடு, நிறுவனத்தின் செல்வாக்குமிக்க Llama திறந்த மாதிரிகள் குடும்பத்தின் அடுத்த பதிப்பைக் குறிக்கிறது, இது AI வளர்ச்சியின் முன்னணியில் போட்டியிடுவதற்கான தொடர்ச்சியான அர்ப்பணிப்பைக் குறிக்கிறது மற்றும் தொழில்துறையில் போட்டி இயக்கவியலை மாற்றியமைக்கக்கூடும். இந்த வெளியீடு மூன்று தனித்துவமான மாதிரிகளை அறிமுகப்படுத்துகிறது, ஒவ்வொன்றும் குறிப்பிட்ட திறன்கள் மற்றும் கணக்கீட்டு கட்டமைப்புகளுடன் வடிவமைக்கப்பட்டுள்ளன, பொதுவான அரட்டை செயல்பாடுகள் முதல் சிக்கலான தரவு செயலாக்கப் பணிகள் வரை பல்வேறு பயன்பாடுகளைப் பூர்த்தி செய்வதை நோக்கமாகக் கொண்டுள்ளது.

Llama 4 குடும்பத்தை அறிமுகப்படுத்துகிறோம்: Scout, Maverick, மற்றும் Behemoth

Llama 4 தலைமுறையின் ஆரம்ப வெளியீடு மூன்று குறிப்பிட்ட பெயரிடப்பட்ட மாதிரிகளை உள்ளடக்கியது: Llama 4 Scout, Llama 4 Maverick, மற்றும் இன்னும் வளர்ச்சியில் உள்ள Llama 4 Behemoth. இந்த மாதிரிகளுக்கான அடித்தளம், பெயரிடப்படாத உரை, படங்கள் மற்றும் வீடியோ உள்ளடக்கம் ஆகியவற்றின் பரந்த அளவிலான பயிற்சித் தரவுத்தொகுப்புகளைக் கொண்டுள்ளது என்று Meta சுட்டிக்காட்டியுள்ளது. இந்த பல-மாதிரி பயிற்சி அணுகுமுறை, மாதிரிகளுக்கு ஒரு அதிநவீன மற்றும் ‘பரந்த காட்சிப் புரிதலை’ வழங்குவதை நோக்கமாகக் கொண்டுள்ளது, அவற்றின் திறன்களை முற்றிலும் உரை அடிப்படையிலான தொடர்புகளுக்கு அப்பால் விரிவுபடுத்துகிறது.

Llama 4 இன் வளர்ச்சிப் பாதை, வேகமாக வளர்ந்து வரும் AI துறையில் உள்ள போட்டி அழுத்தங்களால் பாதிக்கப்பட்டுள்ளது. சர்வதேச AI ஆய்வகங்களிலிருந்து, குறிப்பாக சீன ஆய்வகமான DeepSeek ஐ மேற்கோள் காட்டி, திறந்த மாதிரிகளின் தோற்றம் மற்றும் குறிப்பிடத்தக்க செயல்திறன், Meta அதன் சொந்த வளர்ச்சி முயற்சிகளை விரைவுபடுத்தத் தூண்டியது என்று அறிக்கைகள் தெரிவிக்கின்றன. DeepSeek போன்ற போட்டியாளர்களால் பயன்படுத்தப்படும் வழிமுறைகளை பகுப்பாய்வு செய்வதற்கும் புரிந்துகொள்வதற்கும் Meta குறிப்பிடத்தக்க வளங்களை ஒதுக்கியது, ஒருவேளை சிறப்பு அணிகள் அல்லது ‘போர் அறைகளை’ நிறுவியது, குறிப்பாக மேம்பட்ட AI மாதிரிகளை இயக்குவதற்கும் பயன்படுத்துவதற்கும் தொடர்புடைய கணக்கீட்டு செலவுகளை வெற்றிகரமாகக் குறைத்த நுட்பங்களில் கவனம் செலுத்தியது. இந்த போட்டி நீரோட்டம், முக்கிய தொழில்நுட்ப வீரர்கள் மற்றும் ஆராய்ச்சி நிறுவனங்களிடையே AI செயல்திறன் மற்றும் செயல்பாட்டுத் திறன் ஆகிய இரண்டிலும் முன்னேற்றங்களை அடைவதற்கான தீவிரமான பந்தயத்தை எடுத்துக்காட்டுகிறது.

புதிய Llama 4 வரிசையில் அணுகல் வேறுபடுகிறது. Scout மற்றும் Maverick ஆகியவை டெவலப்பர் சமூகம் மற்றும் பொதுமக்களுக்கு நிறுவப்பட்ட சேனல்கள் மூலம் திறந்த முறையில் கிடைக்கின்றன, இதில் Meta வின் சொந்த Llama.com போர்டல் மற்றும் பரவலாகப் பயன்படுத்தப்படும் AI மேம்பாட்டு மையமான Hugging Face போன்ற கூட்டாளர் தளங்கள் அடங்கும். இந்த திறந்த கிடைக்கும் தன்மை Meta வின் Llama மாதிரிகளைச் சுற்றி ஒரு பரந்த சுற்றுச்சூழல் அமைப்பை வளர்ப்பதற்கான உத்தியை அடிக்கோடிட்டுக் காட்டுகிறது. இருப்பினும், தற்போதைய தொடரில் மிகவும் சக்திவாய்ந்த மாதிரியாக நிலைநிறுத்தப்பட்டுள்ள Behemoth, இன்னும் வளர்ச்சியில் உள்ளது மற்றும் பொது பயன்பாட்டிற்கு இன்னும் வெளியிடப்படவில்லை. அதே நேரத்தில், Meta இந்த புதிய திறன்களை அதன் பயனர் எதிர்கொள்ளும் தயாரிப்புகளில் ஒருங்கிணைக்கிறது. WhatsApp, Messenger, மற்றும் Instagram போன்ற அதன் பயன்பாடுகளின் தொகுப்பில் செயல்படும் அதன் தனியுரிம AI உதவியாளரான Meta AI, Llama 4 இன் சக்தியைப் பயன்படுத்த மேம்படுத்தப்பட்டுள்ளது என்று நிறுவனம் அறிவித்தது. இந்த ஒருங்கிணைப்பு நாற்பது நாடுகளில் வெளியிடப்படுகிறது, இருப்பினும் மேம்பட்ட பன்முறை அம்சங்கள் (உரை, படம் மற்றும் பிற தரவு வகைகளை இணைத்தல்) ஆரம்பத்தில் அமெரிக்காவிற்குள் ஆங்கில மொழி பயனர்களுக்கு மட்டுமே கட்டுப்படுத்தப்பட்டுள்ளன.

உரிம நிலப்பரப்பில் வழிசெலுத்துதல்

சில மாடல்களுக்கு திறந்த தன்மையை வலியுறுத்தினாலும், Llama 4 இன் பயன்பாடு மற்றும் பயன்பாடு குறிப்பிட்ட உரிம விதிமுறைகளால் நிர்வகிக்கப்படுகிறது, இது சில டெவலப்பர்கள் மற்றும் நிறுவனங்களுக்கு தடைகளை ஏற்படுத்தக்கூடும். ஐரோப்பிய ஒன்றியத்திற்குள் தங்கள் முதன்மை வணிக இடத்தைக் கொண்ட பயனர்கள் மற்றும் நிறுவனங்கள் Llama 4 மாதிரிகளைப் பயன்படுத்துவதையோ அல்லது விநியோகிப்பதையோ ஒரு குறிப்பிடத்தக்க கட்டுப்பாடு வெளிப்படையாகத் தடை செய்கிறது. இந்த புவியியல் வரம்பு, ஐரோப்பிய ஒன்றியத்தின் விரிவான AI சட்டம் மற்றும் GDPR போன்ற தற்போதைய தரவு தனியுரிமை விதிமுறைகளால் கட்டாயப்படுத்தப்பட்ட கடுமையான ஆளுகைத் தேவைகளின் நேரடி விளைவாக இருக்கலாம். இந்த சிக்கலான ஒழுங்குமுறை கட்டமைப்புகளில் வழிசெலுத்துவது இப்பகுதியில் Meta வின் வரிசைப்படுத்தல் உத்தியை வடிவமைக்கும் ஒரு குறிப்பிடத்தக்க கருத்தாகத் தோன்றுகிறது.

மேலும், முந்தைய Llama மறு செய்கைகளின் உரிம கட்டமைப்பை எதிரொலிக்கும் வகையில், Meta பெரிய அளவிலான நிறுவனங்களுக்கு ஒரு நிபந்தனையை விதிக்கிறது. 700 மில்லியனுக்கும் அதிகமான மாதாந்திர செயலில் உள்ள பயனர்களைக் கொண்ட நிறுவனங்கள் Meta விடமிருந்து நேரடியாக ஒரு சிறப்பு உரிமத்தை முறையாகக் கோர வேண்டும். முக்கியமாக, இந்த உரிமத்தை வழங்குவதா அல்லது மறுப்பதா என்ற முடிவு முற்றிலும் Meta வின் ‘தனிப்பட்ட விருப்பத்திற்குள்’ உள்ளது. இந்த விதி, Llama சுற்றுச்சூழல் அமைப்பின் சில பகுதிகளின் ‘திறந்த’ தன்மை இருந்தபோதிலும், அதன் மிகவும் மேம்பட்ட மாதிரிகள் சாத்தியமான போட்டி பெரிய தொழில்நுட்ப நிறுவனங்களால் எவ்வாறு பயன்படுத்தப்படுகின்றன என்பதைக் கட்டுப்படுத்த Meta விற்கு திறம்பட வழங்குகிறது, ஒரு அளவு மூலோபாய மேற்பார்வையை பராமரிக்கிறது. இந்த உரிம நுணுக்கங்கள், உயர்-பங்கு AI களத்தில் திறந்த கண்டுபிடிப்புகளை ஊக்குவிப்பதற்கும் மூலோபாய கட்டுப்பாட்டைத் தக்கவைத்துக்கொள்வதற்கும் இடையிலான சிக்கலான இடைவெளியை அடிக்கோடிட்டுக் காட்டுகின்றன.

வெளியீட்டுடன் கூடிய அதன் அதிகாரப்பூர்வ தகவல்தொடர்புகளில், Meta Llama 4 வெளியீட்டை ஒரு முக்கிய தருணமாக வடிவமைத்தது. ‘இந்த Llama 4 மாதிரிகள் Llama சுற்றுச்சூழல் அமைப்பிற்கு ஒரு புதிய சகாப்தத்தின் தொடக்கத்தைக் குறிக்கின்றன’ என்று நிறுவனம் ஒரு வலைப்பதிவு இடுகையில் கூறியது, மேலும் ‘இது Llama 4 சேகரிப்பிற்கான ஆரம்பம் மட்டுமே’ என்றும் добавило. இந்த முன்னோக்கு அறிக்கை, Llama 4 தலைமுறைக்குள் தொடர்ச்சியான வளர்ச்சி மற்றும் விரிவாக்கத்திற்கான ஒரு வரைபடத்தை பரிந்துரைக்கிறது, இந்த வெளியீட்டை ஒரு இறுதி இலக்காக அல்லாமல், AI முன்னேற்றத்தின் தொடர்ச்சியான பயணத்தில் ஒரு குறிப்பிடத்தக்க மைல்கல்லாக நிலைநிறுத்துகிறது.

கட்டடக்கலை கண்டுபிடிப்புகள்: நிபுணர்களின் கலவை (MoE) அணுகுமுறை

Llama 4 தொடரை வேறுபடுத்தும் ஒரு முக்கிய தொழில்நுட்ப பண்பு, அது நிபுணர்களின் கலவை (Mixture of Experts - MoE) கட்டமைப்பை ஏற்றுக்கொள்வதாகும். Llama குடும்பத்திற்குள் இந்த குறிப்பிட்ட வடிவமைப்பு முன்னுதாரணத்தைப் பயன்படுத்தும் முதல் குழு இது என்று Meta எடுத்துக்காட்டுகிறது. MoE அணுகுமுறை, பெரிய மொழி மாதிரிகள் எவ்வாறு கட்டமைக்கப்படுகின்றன மற்றும் பயிற்சி அளிக்கப்படுகின்றன என்பதில் ஒரு குறிப்பிடத்தக்க மாற்றத்தைக் குறிக்கிறது, வள-தீவிர பயிற்சி கட்டத்தின் போதும் மற்றும் பயனர் வினவல்களுக்கு பதிலளிக்கும் செயல்பாட்டு கட்டத்தின் போதும் கணக்கீட்டுத் திறனில் குறிப்பிடத்தக்க நன்மைகளை வழங்குகிறது.

அதன் மையத்தில், ஒரு MoE கட்டமைப்பு சிக்கலான தரவு செயலாக்கப் பணிகளை சிறிய, மேலும் நிர்வகிக்கக்கூடிய துணைப் பணிகளாக சிதைப்பதன் மூலம் செயல்படுகிறது. இந்த துணைப் பணிகள் பின்னர் புத்திசாலித்தனமாக ‘நிபுணர்கள்’ என்று குறிப்பிடப்படும் சிறிய, சிறப்பு வாய்ந்த நரம்பியல் நெட்வொர்க் கூறுகளின் தொகுப்பிற்கு அனுப்பப்படுகின்றன அல்லது ஒப்படைக்கப்படுகின்றன. ஒவ்வொரு நிபுணரும் பொதுவாக குறிப்பிட்ட வகை தரவு அல்லது பணிகளில் சிறந்து விளங்க பயிற்சி அளிக்கப்படுகிறார்கள். கட்டமைப்பிற்குள் ஒரு கேட்டிங் பொறிமுறையானது, உள்ளீட்டுத் தரவு அல்லது வினவலின் ஒரு குறிப்பிட்ட பகுதியைக் கையாள எந்த நிபுணர் அல்லது நிபுணர்களின் கலவை மிகவும் பொருத்தமானது என்பதை தீர்மானிக்கிறது. இது பாரம்பரிய அடர்த்தியான மாதிரி கட்டமைப்புகளுடன் முரண்படுகிறது, அங்கு முழு மாதிரியும் உள்ளீட்டின் ஒவ்வொரு பகுதியையும் செயலாக்குகிறது.

செயல்திறன் ஆதாயங்கள், மாதிரியின் மொத்த அளவுருக்களில் (தேர்ந்தெடுக்கப்பட்ட நிபுணர்களுக்குச் சொந்தமான ‘செயலில்’ உள்ள அளவுருக்கள்) ஒரு துணைக்குழு மட்டுமே எந்தவொரு குறிப்பிட்ட பணிக்கும் ஈடுபடுத்தப்படுகிறது என்பதிலிருந்து உருவாகின்றன. இந்த தேர்ந்தெடுக்கப்பட்ட செயல்படுத்தல், ஒரு பெரிய, அடர்த்தியான மாதிரியின் முழுமையையும் செயல்படுத்துவதோடு ஒப்பிடும்போது கணக்கீட்டுச் சுமையை கணிசமாகக் குறைக்கிறது.

Meta இந்த கட்டமைப்பை செயல்பாட்டில் விளக்கும் குறிப்பிட்ட விவரங்களை வழங்கியது:

  • Maverick: இந்த மாதிரி 400 பில்லியன் கணிசமான மொத்த அளவுரு எண்ணிக்கையைக் கொண்டுள்ளது. இருப்பினும், 128 தனித்துவமான ‘நிபுணர்களை’ உள்ளடக்கிய MoE வடிவமைப்பிற்கு நன்றி, செயலாக்கத்தின் போது எந்த நேரத்திலும் 17 பில்லியன் அளவுருக்கள் மட்டுமே செயலில் ஈடுபடுத்தப்படுகின்றன. அளவுருக்கள் பெரும்பாலும் ஒரு மாதிரியின் கற்றல் மற்றும் சிக்கல் தீர்க்கும் சிக்கலுக்கான திறனுக்கான தோராயமான ப்ராக்ஸியாகக் கருதப்படுகின்றன.
  • Scout: இதேபோல் கட்டமைக்கப்பட்டுள்ளது, Scout 16 ‘நிபுணர்களிடையே’ விநியோகிக்கப்பட்ட 109 பில்லியன் மொத்த அளவுருக்களைக் கொண்டுள்ளது, இதன் விளைவாக Maverick ஐப் போலவே 17 பில்லியன் செயலில் உள்ள அளவுருக்கள் உள்ளன.

இந்த கட்டடக்கலைத் தேர்வு, Meta பரந்த ஒட்டுமொத்த திறன் கொண்ட (அதிக மொத்த அளவுரு எண்ணிக்கைகள்) மாதிரிகளை உருவாக்க அனுமதிக்கிறது, அதே நேரத்தில் அனுமானத்திற்கான (வினவல் செயலாக்கம்) நிர்வகிக்கக்கூடிய கணக்கீட்டுத் தேவைகளைப் பராமரிக்கிறது, இது அவற்றை அளவில் வரிசைப்படுத்தவும் இயக்கவும் மிகவும் நடைமுறைக்குரியதாக மாற்றும்.

செயல்திறன் வரையறைகள் மற்றும் மாதிரி சிறப்புகள்

Meta அதன் புதிய மாதிரிகளை போட்டித்தன்மையுடன் நிலைநிறுத்தியுள்ளது, OpenAI, Google, மற்றும் Anthropic போன்ற போட்டியாளர்களின் முக்கிய மாதிரிகளுக்கு எதிராக Llama 4 ஐ ஒப்பிடும் உள் வரையறை முடிவுகளை வெளியிட்டுள்ளது.

Maverick, Meta ஆல் ‘பொது உதவியாளர் மற்றும் அரட்டை’ பயன்பாடுகளுக்கு உகந்ததாக நியமிக்கப்பட்டுள்ளது, இதில் படைப்பாற்றல் எழுத்து மற்றும் குறியீடு உருவாக்கம் போன்ற பணிகள் அடங்கும், OpenAI இன் GPT-4o மற்றும் Google இன் Gemini 2.0 போன்ற மாதிரிகளுடன் ஒப்பிடும்போது குறிப்பிட்ட வரையறைகளில் உயர்ந்த செயல்திறனை வெளிப்படுத்துகிறது. இந்த வரையறைகள் குறியீட்டுத் திறன், தர்க்கரீதியான பகுத்தறிவு, பன்மொழித் திறன்கள், உரையின் நீண்ட வரிசைகளைக் கையாளுதல் (long-context), மற்றும் படப் புரிதல் போன்ற பகுதிகளை உள்ளடக்கியது. இருப்பினும், Meta வின் சொந்த தரவு, Maverick தற்போது கிடைக்கும் மிகச் சமீபத்திய மற்றும் மிகவும் சக்திவாய்ந்த மாதிரிகளின் திறன்களை, அதாவது Google இன் Gemini 2.5 Pro, Anthropic இன் Claude 3.7 Sonnet, அல்லது OpenAI இன் எதிர்பார்க்கப்படும் GPT-4.5 போன்றவற்றை, தொடர்ந்து மிஞ்சவில்லை என்பதைக் குறிக்கிறது. இது Maverick உயர் செயல்திறன் அடுக்கில் ஒரு வலுவான நிலையை நோக்கமாகக் கொண்டுள்ளது, ஆனால் போட்டியாளர்களின் புதிய முதன்மை மாதிரிகளுக்கு எதிராக அனைத்து அளவீடுகளிலும் முழுமையான முதலிடத்தைப் பெறாது என்று கூறுகிறது.

Scout, மறுபுறம், வெவ்வேறு பலங்களுக்கு ஏற்ப வடிவமைக்கப்பட்டுள்ளது. விரிவான ஆவணங்களைச் சுருக்கவும், பெரிய, சிக்கலான குறியீடு தளங்களில் பகுத்தறிவு செய்யவும் அதன் திறன்கள் முன்னிலைப்படுத்தப்படுகின்றன. Scout இன் ஒரு குறிப்பாக தனித்துவமான மற்றும் வரையறுக்கும் அம்சம் அதன் விதிவிலக்காக பெரிய context window ஆகும், இது 10 மில்லியன் tokens வரை கையாளும் திறன் கொண்டது. Tokens என்பது மொழி மாதிரிகள் செயலாக்கும் உரை அல்லது குறியீட்டின் அடிப்படை அலகுகள் (எ.கா., ஒரு சொல் ‘un-der-stand-ing’ போன்ற பல tokens ஆக பிரிக்கப்படலாம்). ஒரு 10-மில்லியன்-token context window, நடைமுறை அடிப்படையில், ஒரே நேரத்தில் ஒரு பெரிய அளவிலான தகவலை உட்கொள்ளும் மற்றும் செயலாக்கும் திறனுக்கு மொழிபெயர்க்கிறது - இது மில்லியன் கணக்கான சொற்கள் அல்லது குறியீட்டின் முழு நூலகங்களுக்கு சமமாக இருக்கலாம். இது Scout ஐ மிக நீண்ட ஆவணங்கள் அல்லது சிக்கலான நிரலாக்கத் திட்டங்களில் ஒத்திசைவையும் புரிதலையும் பராமரிக்க அனுமதிக்கிறது, இது சிறிய context window களைக் கொண்ட மாதிரிகளுக்கு சவாலான ஒரு சாதனையாகும். இந்த பரந்த உரை உள்ளீட்டுடன் படங்களையும் இது செயலாக்க முடியும்.

இந்த மாதிரிகளை இயக்குவதற்கான வன்பொருள் தேவைகள் அவற்றின் அளவையும் கட்டமைப்பையும் பிரதிபலிக்கின்றன. Meta வின் மதிப்பீடுகளின்படி:

  • Scout ஒப்பீட்டளவில் திறமையானது, ஒரு உயர்நிலை Nvidia H100 GPU இல் இயங்கும் திறன் கொண்டது.
  • Maverick, MoE செயல்திறன் இருந்தபோதிலும் அதன் பெரிய மொத்த அளவுரு எண்ணிக்கையுடன், கணிசமான வளங்களைக் கோருகிறது, இதற்கு ஒரு Nvidia H100 DGX அமைப்பு (இது பொதுவாக பல H100 GPU களைக் கொண்டுள்ளது) அல்லது அதற்கு சமமான கணக்கீட்டு சக்தி தேவைப்படுகிறது.

வரவிருக்கும் Behemoth மாதிரிக்கு இன்னும் வலிமையான வன்பொருள் உள்கட்டமைப்பு தேவைப்படும் என்று எதிர்பார்க்கப்படுகிறது. Behemoth 288 பில்லியன் செயலில் உள்ள அளவுருக்களுடன் (சுமார் இரண்டு டிரில்லியன் மொத்த அளவுருக்களில், 16 நிபுணர்களிடையே பரவியுள்ளது) வடிவமைக்கப்பட்டுள்ளது என்று Meta வெளிப்படுத்தியது. ஆரம்ப உள் வரையறைகள் Behemoth ஐ GPT-4.5, Claude 3.7 Sonnet, மற்றும் Gemini 2.0 Pro (குறிப்பாக, மிகவும் மேம்பட்ட Gemini 2.5 Pro அல்ல) போன்ற மாதிரிகளை STEM (அறிவியல், தொழில்நுட்பம், பொறியியல் மற்றும் கணிதம்) திறன்களில் கவனம் செலுத்தும் பல மதிப்பீடுகளில், குறிப்பாக சிக்கலான கணித சிக்கல் தீர்க்கும் பகுதிகளில், மிஞ்சும் வகையில் நிலைநிறுத்துகின்றன.

இருப்பினும், தற்போது அறிவிக்கப்பட்ட Llama 4 மாதிரிகள் எதுவும் OpenAI இன் வளர்ச்சி o1 மற்றும் o3-mini கருத்துகளின் பாணியில் ‘பகுத்தறிவு’ மாதிரிகளாக வெளிப்படையாக வடிவமைக்கப்படவில்லை என்பது கவனிக்கத்தக்கது. இந்த சிறப்பு வாய்ந்த பகுத்தறிவு மாதிரிகள் பொதுவாக அவற்றின் பதில்களின் உள் உண்மைச் சரிபார்ப்பு மற்றும் மறு செய்கை சுத்திகரிப்புக்கான வழிமுறைகளை உள்ளடக்குகின்றன, இது சாத்தியமான நம்பகமான மற்றும் துல்லியமான பதில்களுக்கு வழிவகுக்கிறது, குறிப்பாக உண்மை வினவல்களுக்கு. இதன் பரிமாற்றம் பெரும்பாலும் அதிகரித்த தாமதமாகும், அதாவது Llama 4 குடும்பத்தில் உள்ளவை போன்ற மிகவும் பாரம்பரியமான பெரிய மொழி மாதிரிகளுடன் ஒப்பிடும்போது பதில்களை உருவாக்க அதிக நேரம் எடுக்கும், அவை வேகமான உருவாக்கத்திற்கு முன்னுரிமை அளிக்கின்றன.

உரையாடல் எல்லைகளை சரிசெய்தல்: சர்ச்சைக்குரிய தலைப்புகள்

Llama 4 வெளியீட்டின் ஒரு புதிரான அம்சம், Meta மாதிரிகளின் மறுமொழி நடத்தையை, குறிப்பாக உணர்திறன் அல்லது சர்ச்சைக்குரிய விஷயங்கள் தொடர்பாக, வேண்டுமென்றே சரிசெய்வதை உள்ளடக்கியது. Llama 3 குடும்பத்தில் உள்ள அவற்றின் முன்னோடிகளுடன் ஒப்பிடும்போது, Llama 4 மாதிரிகள் ‘சர்ச்சைக்குரிய’ கேள்விகளுக்கு பதிலளிக்க மறுப்பது குறைவாக இருக்கும் வகையில் சரிசெய்யப்பட்டுள்ளன என்று நிறுவனம் வெளிப்படையாகக் கூறியது.

Meta வின் கூற்றுப்படி, Llama 4 இப்போது முந்தைய பதிப்புகள் மறுத்திருக்கக்கூடிய அல்லது ஒரு பொதுவான மறுப்பை வழங்கியிருக்கக்கூடிய ‘விவாதிக்கப்பட்ட’ அரசியல் மற்றும் சமூக தலைப்புகளில் ஈடுபட அதிக விருப்பம் கொண்டுள்ளது. மேலும், Llama 4 முற்றிலும் ஈடுபட மறுக்கும் தூண்டுதல்களின் வகைகள் தொடர்பாக ‘கணிசமாக சமநிலையான’ அணுகுமுறையை வெளிப்படுத்துகிறது என்று நிறுவனம் கூறுகிறது. தீர்ப்பு வழங்காமல் பயனுள்ள மற்றும் உண்மை பதில்களை வழங்குவதே கூறப்பட்ட குறிக்கோள்.

ஒரு Meta செய்தித் தொடர்பாளர் இந்த மாற்றத்தைப் பற்றி விரிவாகக் கூறினார், TechCrunch இடம் கூறினார்: ‘[Y]ou can count on [Llama 4] to provide helpful, factual responses without judgment… [W]e’re continuing to make Llama more responsive so that it answers more questions, can respond to a variety of different viewpoints […] and doesn’t favor some views over others.’

செயற்கை நுண்ணறிவு அமைப்புகளில் உணரப்பட்ட சார்புகள் குறித்த பொது மற்றும் அரசியல் விவாதங்கள் தொடர்ந்து நடைபெற்று வரும் பின்னணியில் இந்த சரிசெய்தல் நிகழ்கிறது. Elon Musk மற்றும் துணிகர முதலீட்டாளர் David Sacks போன்ற Trump நிர்வாகத்துடன் தொடர்புடைய முக்கிய நபர்கள் உட்பட சில அரசியல் பிரிவுகள் மற்றும் வர்ணனையாளர்கள், பிரபலமான AI சாட்போட்கள் அரசியல் சார்புநிலையை வெளிப்படுத்துவதாக குற்றச்சாட்டுகளைக் குரல் கொடுத்துள்ளனர், இது பெரும்பாலும் ‘woke’ என்று விவரிக்கப்படுகிறது, பழமைவாத கண்ணோட்டங்களை தணிக்கை செய்வதாகவோ அல்லது ஒரு தாராளவாத கண்ணோட்டத்தை நோக்கித் திரிக்கப்பட்ட தகவல்களை வழங்குவதாகவோ கூறப்படுகிறது. Sacks, உதாரணமாக, கடந்த காலத்தில் OpenAI இன் ChatGPT ஐ குறிப்பாக விமர்சித்துள்ளார், இது ‘woke ஆக இருக்க திட்டமிடப்பட்டது’ என்றும் அரசியல் விஷயங்களில் நம்பமுடியாதது என்றும் கூறினார்.

இருப்பினும், AI இல் உண்மையான நடுநிலைமையை அடைவது மற்றும் சார்புகளை நீக்குவது என்ற சவால், தொழில்நுட்ப சமூகத்திற்குள் நம்பமுடியாத அளவிற்கு சிக்கலான மற்றும் தொடர்ச்சியான பிரச்சனையாக (‘intractable’) பரவலாக அங்கீகரிக்கப்பட்டுள்ளது. AI மாதிரிகள் தாங்கள் பயிற்சி பெற்ற பரந்த தரவுத்தொகுப்புகளிலிருந்து வடிவங்களையும் தொடர்புகளையும் கற்றுக்கொள்கின்றன, மேலும் இந்த தரவுத்தொகுப்புகள் தவிர்க்க முடியாமல் அவை கொண்டிருக்கும் மனிதனால் உருவாக்கப்பட்ட உரை மற்றும் படங்களில் உள்ள சார்புகளைப் பிரதிபலிக்கின்றன. முற்றிலும் சார்பற்ற அல்லது அரசியல் ரீதியாக நடுநிலையான AI ஐ உருவாக்கும் முயற்சிகள், வெளிப்படையாக அதை நோக்கமாகக் கொண்ட நிறுவனங்களால் கூட, கடினமானவை என்பதை நிரூபித்துள்ளன. Elon Musk இன் சொந்த AI முயற்சியான xAI, சில அரசியல் நிலைப்பாடுகளை மற்றவற்றிற்கு மேல் ஆதரிப்பதைத் தவிர்க்கும் ஒரு சாட்போட்டை உருவாக்குவதில் சவால்களை எதிர்கொண்டதாகக் கூறப்படுகிறது.

உள்ளார்ந்த தொழில்நுட்ப சிரமங்கள் இருந்தபோதிலும், Meta மற்றும் OpenAI உட்பட முக்கிய AI டெவலப்பர்களிடையே உள்ள போக்கு, சர்ச்சைக்குரிய தலைப்புகளைத் தவிர்ப்பதைக் குறைக்கும் வகையில் மாதிரிகளை சரிசெய்வதை நோக்கி நகர்வதாகத் தோன்றுகிறது. இது பாதுகாப்பு வடிப்பான்கள் மற்றும் மறுமொழி வழிகாட்டுதல்களை கவனமாக அளவீடு செய்வதை உள்ளடக்கியது, இது முன்னர் அனுமதிக்கப்பட்டதை விட பரந்த அளவிலான கேள்விகளுடன் ஈடுபட அனுமதிக்கிறது, அதே நேரத்தில் தீங்கு விளைவிக்கும் அல்லது வெளிப்படையாக சார்புடைய உள்ளடக்கத்தின் உருவாக்கத்தைத் தணிக்க முயற்சிக்கிறது. இந்த நுணுக்கமான சரிசெய்தல், AI நிறுவனங்கள் திறந்த உரையாடலை ஊக்குவித்தல், பயனர் பாதுகாப்பை உறுதி செய்தல் மற்றும் அவற்றின் சக்திவாய்ந்த தொழில்நுட்பங்களைச் சுற்றியுள்ள சிக்கலான சமூக-அரசியல் எதிர்பார்ப்புகளில் வழிசெலுத்துதல் ஆகியவற்றுக்கு இடையில் செய்ய வேண்டிய நுட்பமான சமநிலைப்படுத்தும் செயலைப் பிரதிபலிக்கிறது. சர்ச்சைக்குரிய வினவல்களைக் கையாள்வதில் அதன் வெளிப்படையாகக் கூறப்பட்ட சரிசெய்தல்களுடன் Llama 4 இன் வெளியீடு, இந்த சிக்கலான நிலப்பரப்பில் வழிசெலுத்துவதில் Meta வின் சமீபத்திய படியைக் குறிக்கிறது.