மெட்டாவின் லாமா: ஒரு நிறுவன முத்திரையா?

சமீபத்திய AI கண்டுபிடிப்புகளில் Llama-வின் முக்கியத்துவம் குறைந்து வருகிறதா? டெவலப்பர்கள் மற்றும் AI சமூகத்தின் பார்வை என்ன? திறந்த மூல மாதிரியாக இதன் எதிர்காலம் எப்படி இருக்கும்?

LlamaCon ஏமாற்றங்கள் மற்றும் எதிர்பார்ப்புகள்

LlamaCon மாநாட்டில், Meta-வின் திறந்த மூல LLM-க்காக அர்ப்பணிக்கப்பட்ட முதல் மாநாட்டில், எதிர்பார்ப்புகள் பூர்த்தி செய்யப்படவில்லை என்ற உணர்வு நிலவியது. பல டெவலப்பர்கள் ஒரு அதிநவீன பகுத்தறிவு மாதிரியை அல்லது DeepSeek-ன் V3 மற்றும் Alibaba-வின் கிளவுட் கம்ப்யூட்டிங் பிரிவால் உருவாக்கப்பட்ட Qwen போன்ற போட்டியாளர்களை விட சிறப்பாக செயல்படும் ஒரு மாதிரியையாவது எதிர்பார்த்தனர்.

இத்தகைய அறிவிப்புகள் இல்லாதது, AI போட்டியில் Llama பின்தங்கிவிட்டது என்ற கவலைகளை ஏற்படுத்தியது. மாநாட்டிற்கு ஒரு மாதத்திற்கு முன்பு, Meta அதன் Llama குடும்பத்தின் நான்காவது தலைமுறையை வெளியிட்டது, இதில் திறந்த எடை மாதிரிகள் Llama 4 Scout மற்றும் Llama 4 Maverick அடங்கும். Scout ஒரு GPU-வில் திறமையாக செயல்பட வடிவமைக்கப்பட்டது, Maverick மற்ற அடிப்படை மாதிரிகளுக்கு போட்டியாக ஒரு பெரிய மாதிரியாக வடிவமைக்கப்பட்டது.

Scout மற்றும் Maverick உடன், Meta இன்னும் பயிற்சியில் இருக்கும் Llama 4 Behemoth-ஐ ஒரு முன்னோட்டமாக வழங்கியது. Behemoth-ன் நோக்கம் டிஸ்டிலேஷனை எளிதாக்குவதாகும், இது ஒரு பெரிய, பொதுவான மாதிரியிலிருந்து சிறிய, சிறப்பு மாதிரியை உருவாக்கும் ஒரு நுட்பமாகும்.

இருப்பினும், Behemoth வெளியீட்டில் தாமதங்கள் மற்றும் Llama 4 மூலம் போட்டித்திறன் மிக்க செயல்திறனை அடைவதில் சவால்கள் இருப்பதாக அறிக்கைகள் வெளிவந்தன. Meta அதிநவீன திறன்களைக் கொண்டுள்ளது என்று கூறிய போதிலும், Llama இனி முன்னணி வகிக்கவில்லை என்பதே சில டெவலப்பர்களின் கருத்தாக இருந்தது.

போட்டியாளர்களின் எழுச்சி: Qwen மற்றும் DeepSeek

LlamaCon மற்றும் Llama 4 மாதிரிகளைச் சுற்றியுள்ள ஏமாற்றம், Meta-வின் திறந்த மூல LLM-கள் தொழில்நுட்ப செயல்திறன் மற்றும் டெவலப்பர்கள் மத்தியில் ஆர்வத்தை இழந்து வருகிறது என்ற பரவலான உணர்வை பிரதிபலிக்கிறது. Meta திறந்த மூலக் கொள்கைகள், சுற்றுச்சூழல் அமைப்பு உருவாக்கம் மற்றும் கண்டுபிடிப்புகளுக்கு உறுதிபூண்டுள்ள நிலையில், DeepSeek, Qwen மற்றும் OpenAI போன்ற போட்டியாளர்கள் பகுத்தறிவு, கருவி பயன்பாடு மற்றும் உண்மையான உலக பயன்பாடு போன்ற முக்கியமான பகுதிகளில் வேகமாக முன்னேறி வருகின்றனர்.

ஒரு டெவலப்பர், Vineeth Sai Varikuntla, தனது ஏமாற்றத்தை வெளிப்படுத்தினார், Llama பொதுவான பயன்பாட்டு நிகழ்வுகள் மற்றும் பகுத்தறிவில் Qwen மற்றும் DeepSeek-ஐ விஞ்சும் என்று நம்பினார், ஆனால் Qwen கணிசமாக முன்னிலையில் இருப்பதாகக் கண்டறிந்தார்.

Meta ஒரு முன்னணி திறந்த மூல LLM ஆக Llamaவின் நிலையை தக்கவைக்க எதிர்கொள்ளும் சவால்களை இது அடிக்கோடிட்டுக் காட்டுகிறது. Llama-வின் ஆரம்ப வெளியீடுகள் குறிப்பிடத்தக்க கவனத்தையும் பாராட்டையும் பெற்றாலும், பெருகிய முறையில் திறன் வாய்ந்த மாற்றுகள் போட்டியிடும் சூழலை தீவிரப்படுத்தியுள்ளன.

ஒரு நம்பிக்கைக்குரிய ஆரம்பம்: Llama 2-ன் தாக்கம்

Llama-வைச் சுற்றியுள்ள தற்போதைய கதையை முழுமையாகப் புரிந்துகொள்ள, அதன் தோற்றம் மற்றும் அது உருவாக்கிய ஆரம்ப உற்சாகத்தை நினைவில் கொள்வது அவசியம். 2023 இல், Nvidia CEO Jensen Huang, Llama 2 இன் வெளியீட்டை அந்த ஆண்டின் "AI-இல் மிகப்பெரிய நிகழ்வு" என்று பாராட்டினார். ஜூலை 2024 வாக்கில், Llama 3 இன் வெளியீடு ஒரு திருப்புமுனையாகக் கருதப்பட்டது, இது OpenAI-ன் ஆதிக்கத்திற்கு சவால் விடக்கூடிய திறந்த LLM ஆகும்.

Llama 3 வருகை கம்ப்யூட்டிங் சக்திக்கான தேவையை உடனடியாகத் தூண்டியது, இது GPU வாடகை விலைகளை அதிகரித்தது என்று SemiAnalysis இல் தலைமை ஆய்வாளர் Dylan Patel கூறினார். Google இல் "Meta" மற்றும் "Llama" ஆகிய சொற்களுக்கான தேடல்கள் இந்த காலகட்டத்தில் உச்சத்தை அடைந்தன, இது புதிய மாதிரியில் பரவலான ஆர்வத்தைக் குறிக்கிறது.

Llama 3 ஒரு அமெரிக்காவில் தயாரிக்கப்பட்ட, திறந்த மற்றும் உயர்தர LLM ஆக கொண்டாடப்பட்டது. இது தொடர்ந்து தொழில்துறை அளவுகோல்களை விட முதலிடம் வகிக்கவில்லை என்றாலும், AI சமூகத்தில் கணிசமான செல்வாக்கையும் முக்கியத்துவத்தையும் செலுத்தியது. இருப்பினும், இந்த இயக்கம் படிப்படியாக மாறியுள்ளது.

கட்டிடக்கலை மாற்றங்கள் மற்றும் விமர்சனங்கள்

Llama 4 மாதிரிகள் ஒரு "mixture of experts" கட்டிடக்கலையை அறிமுகப்படுத்தின, இது DeepSeek ஆல் பிரபலப்படுத்தப்பட்ட ஒரு வடிவமைப்பு. இந்த கட்டிடக்கலை ஒரு குறிப்பிட்ட பணிக்கு மிகவும் பொருத்தமான நிபுணத்துவத்தை மட்டுமே இயக்க மாதிரியை செயல்படுத்துகிறது, இதன் மூலம் செயல்திறனை மேம்படுத்துகிறது.

எவ்வாறாயினும், Llama 4 இன் வெளியீடு பொது பெஞ்ச்மார்க்கிங்கிற்கு பயன்படுத்தப்பட்ட பதிப்பு பதிவிறக்கம் மற்றும் பயன்படுத்தக் கிடைக்கக்கூடிய பதிப்பிலிருந்து வேறுபட்டது என்று டெவலப்பர்கள் கண்டுபிடித்தபோது விமர்சனங்களை சந்தித்தது. இந்த முரண்பாடு "லீடர்போர்டை கேமிங்" செய்வதற்கான குற்றச்சாட்டுகளுக்கு வழிவகுத்தது, Meta மறுத்தது, கேள்விக்குரிய மாறுபாடு சோதனைக்குரியது என்றும் மாதிரியின் பல பதிப்புகளை மதிப்பீடு செய்வது வழக்கமான நடைமுறை என்றும் கூறியது.

Meta இன் விளக்கங்கள் இருந்தபோதிலும், Llama தனது போட்டித்திறனை தக்கவைக்க போராடுகிறது என்ற கருத்துக்கு சர்ச்சை பங்களித்தது. போட்டியிடும் மாதிரிகள் தொடர்ந்து முன்னேறி வருவதால், Meta ஒரு தெளிவான திசை இல்லாமல் இருப்பது போல் தோன்றியது.

டெவலப்பர் தத்தெடுப்பை அளவிடுதல்: ஒரு சிக்கலான பணி

எந்த LLM குடும்பம் டெவலப்பர்கள் மத்தியில் மிகவும் பிரபலமானது என்பதை தீர்மானிப்பது ஒரு சவாலான பணியாகும். இருப்பினும், Llama-வின் சமீபத்திய மாதிரிகள் முன்னணி வகிப்பதாக கிடைக்கக்கூடிய தரவு கூறுகிறது.

குறிப்பாக, Qwen இணையத்தில் பல்வேறு லீடர்போர்டுகளில் தொடர்ந்து உயர் இடத்தைப் பெறுகிறது. செயல்திறன் அடிப்படையில் மாதிரிகளை தரவரிசைப்படுத்தும் ஒரு தளமான Artificial Analysis-ன் படி, Llama 4 Maverick மற்றும் Scout OpenAI-ன் GPT-4 மாதிரிக்கு சற்று மேலே நிலைநிறுத்தப்பட்டுள்ளன (முந்தைய ஆண்டின் இறுதியில் வெளியிடப்பட்டது) மற்றும் நுண்ணறிவின் அடிப்படையில் xAI-ன் Grok மற்றும் Anthropic-ன் Claude-க்கு கீழே உள்ளன.

OpenRouter, டெவலப்பர்களுக்கு பல்வேறு மாடல்களுக்கான அணுகலை வழங்கும் ஒரு தளம் மற்றும் API பயன்பாட்டின் அடிப்படையில் லீடர்போர்டுகளை வெளியிடுகிறது, மே மாத தொடக்கத்தில் முதல் 20 மாடல்களில் Llama 3.3 ஐக் காட்டுகிறது, ஆனால் Llama 4 இல்லை.

இந்த தரவு புள்ளிகள், உறுதியானவை அல்ல என்றாலும், Llama-வின் சமீபத்திய மறு செய்கைகள் அதன் முன்னோடிகளுடன் டெவலப்பர்களுடன் வலுவாக எதிரொலிக்கவில்லை என்பதை உணர்த்துகின்றன.

அளவுகோல்களுக்கு அப்பால்: கருவி பயன்பாடு மற்றும் பகுத்தறிவு

Llama 4 இன் நிலையான மதிப்பீடுகள் மோசமாக இருந்திருக்கலாம், ஆனால் அடக்கமான உற்சாகம் வெறுமனே அளவீட்டு அளவீடுகளுக்கு அப்பாற்பட்ட காரணிகளிலிருந்து வருகிறது என்று நிபுணர்கள் வாதிடுகின்றனர்.

SemiAnalysis இல் உள்ள ஒரு ஆய்வாளர் AJ Kourabi, "tool calling" மற்றும் ஒரு எளிய சாட்போட் செயல்பாட்டிற்கு அப்பால் நீட்டிக்கக்கூடிய மாதிரியின் திறன் ஆகியவற்றின் முக்கியத்துவத்தை வலியுறுத்துகிறார். Tool calling என்பது இணையத்தில் அல்லது ஒரு பயனரின் சாதனத்தில் உள்ள பிற பயன்பாடுகளை அணுகுவதற்கும் அறிவுறுத்துவதற்கும் ஒரு மாதிரியின் திறனைக் குறிக்கிறது, இது ஏஜென்டிக் AI க்கு முக்கியமான அம்சமாகும், இது பயணம் மற்றும் செலவுகளை நிர்வகிப்பது போன்ற பணிகளை தானியக்கமாக்குவதாக உறுதியளிக்கிறது.

Llama மாதிரிகள் அதன் API மூலம் tool calling ஐ ஆதரிக்கின்றன என்று Meta கூறியுள்ளது. இருப்பினும், ஒரு டெவலப்பரும் YouTuber-உமான Theo Browne, ஏஜென்டிக் கருவிகள் முக்கியத்துவம் பெறும் அதே வேளையில் tool calling என்பது அதிநவீன பொருத்தத்திற்கு ஒரு தேவையாகிவிட்டது என்று வாதிடுகிறார்.

Anthropic கருவி பயன்பாட்டில் ஆரம்பகால தலைவராக வளர்ந்துள்ளார், மேலும் OpenAI போன்ற தனியுரிம மாதிரிகள் வேகமாக முன்னேறி வருகின்றன. சரியான பதிலை உருவாக்க சரியான கருவியை நம்பகத்தன்மையுடன் அழைக்கக்கூடிய திறன் மிகவும் மதிப்பு வாய்ந்தது, மேலும் OpenAI இந்த திறனுக்கு முன்னுரிமை அளிப்பதில் தனது கவனத்தை செலுத்தியுள்ளது.

Meta பின்தங்கிவிட்டது என்பதற்கான குறிப்பிடத்தக்க குறிகாட்டியாக ஒரு வலுவான பகுத்தறிவு மாதிரி இல்லாதது என்று Kourabi வாதிடுகிறார். பகுத்தறிவு என்பது ஏஜென்டிக் AI சமன்பாட்டில் ஒரு அடிப்படை உறுப்பாகக் கருதப்படுகிறது, இது பணிகளை பகுப்பாய்வு செய்து சரியான நடவடிக்கைகளைத் தீர்மானிக்க மாதிரிகளை செயல்படுத்துகிறது.

Llama-வின் இடம்: நடைமுறை பயன்பாடுகள்

AI ஆராய்ச்சியின் முன்னணியில் அதன் நிலை குறித்த கவலைகள் இருந்தபோதிலும், Llama பல டெவலப்பர்கள் மற்றும் நிறுவனங்களுக்கு ஒரு மதிப்புமிக்க கருவியாக உள்ளது.

RockerBox இன் தயாரிப்புத் தலைவர் Nate Jones, டெவலப்பர்கள் தங்கள் விண்ணப்பத்தில் Llama வை சேர்க்க அறிவுறுத்துகிறார், ஏனெனில் மாடலைப் பற்றிய அறிமுகம் எதிர்காலத்தில் தேவைப்படலாம்.

GAI Insights இன் CEO மற்றும் முதன்மை ஆய்வாளர் Paul Baier, Llama பல நிறுவனங்களுக்கான AI உத்திகளின் முக்கிய அங்கமாக இருக்கும் என்று நம்புகிறார், குறிப்பாக தொழில்நுட்பத் தொழிலுக்கு வெளியே உள்ள நிறுவனங்களுக்கு.

குறைவான சிக்கலான பணிகளை கையாள்வதற்கும் செலவுகளைக் கட்டுப்படுத்துவதற்கும் திறந்த மூல மாதிரிகளின் முக்கியத்துவத்தை நிறுவனங்கள் அங்கீகரிக்கின்றன, Llama ஒரு முக்கிய எடுத்துக்காட்டு. பல நிறுவனங்கள் தங்கள் பல்வேறு தேவைகளைப் பூர்த்தி செய்ய மூடிய மற்றும் திறந்த மாதிரிகளின் கலவையை விரும்புகின்றன.

Snowflake இன் AI தலைவர் Baris Gultekin, வாடிக்கையாளர்கள் பெரும்பாலும் பெஞ்ச்மார்க்குகளை மட்டுமே நம்பாமல், அவர்களின் குறிப்பிட்ட பயன்பாட்டு நிகழ்வுகளின் அடிப்படையில் மாதிரிகளை மதிப்பீடு செய்கிறார்கள் என்று குறிப்பிடுகிறார். குறைந்த செலவில், Llama பெரும்பாலும் பல பயன்பாடுகளுக்கு போதுமானதாக இருக்கும்.

Snowflake இல், விற்பனை அழைப்பு டிரான்ஸ்கிரிப்ட்களைச் சுருக்குதல் மற்றும் வாடிக்கையாளர் மதிப்புரைகளில் இருந்து கட்டமைக்கப்பட்ட தகவல்களைப் பிரித்தெடுத்தல் போன்ற பணிகளுக்கு Llama பயன்படுத்தப்படுகிறது. Dremio இல், Llama SQL குறியீட்டை உருவாக்கி மார்க்கெட்டிங் மின்னஞ்சல்களை எழுதுகிறது.

Dremio இன் இணை நிறுவனர் மற்றும் தலைமை தயாரிப்பு அதிகாரி Tomer Shiran, குறிப்பிட்ட மாதிரி 80% பயன்பாடுகளுக்கு முக்கியமானதாக இல்லாமல் இருக்கலாம், ஏனெனில் பெரும்பாலான மாதிரிகள் இப்போது அடிப்படைத் தேவைகளைப் பூர்த்தி செய்ய "போதுமானதாக" உள்ளன என்று கூறுகிறார்.

மாறுபட்ட சூழல்: Llama-வின் ஒருங்கிணைந்த பங்கு

Llama சில பகுதிகளில் தனியுரிம மாதிரிகளுடன் நேரடிப் போட்டியிலிருந்து விலகிச் செல்லக்கூடும் என்றாலும், ஒட்டுமொத்த AI சூழல் மிகவும் மாறுபட்டதாக மாறி வருகிறது, மேலும் Llama-வின் பங்கு குறிப்பிட்ட இடங்களில் ஒருங்கிணைக்கப்படுகிறது.

பயனர்கள் தங்கள் சொந்த பயன்பாட்டு நிகழ்வுகளில் மாதிரிகளை சோதிப்பதற்கு முன்னுரிமை அளிப்பதால், அளவுகோல்கள் மாதிரி தேர்வின் முதன்மை இயக்கிகள் அல்ல என்று Shiran வலியுறுத்துகிறார். ஒரு வாடிக்கையாளரின் தரவில் ஒரு மாதிரியின் செயல்திறன் மிக முக்கியமானது, மேலும் இந்த செயல்திறன் காலப்போக்கில் மாறக்கூடும்.

மாதிரி தேர்வு பெரும்பாலும் ஒரு நேர நிகழ்வாக இல்லாமல், பயன்பாட்டு வழக்கு சார்ந்த முடிவு என்று Gultekin மேலும் கூறுகிறார்.

சமீபத்திய முன்னேற்றங்களை தொடர்ந்து தேடும் டெவலப்பர்களை Llama இழக்க நேரிடலாம், ஆனால் நடைமுறை AI- આધારિત கருவிகளை உருவாக்குவதில் கவனம் செலுத்தும் பல டெவலப்பர்களின் ஆதரவை இது தக்க வைத்துக் கொண்டுள்ளது.

இந்த இயக்கம் Meta-வின் பரந்த திறந்த மூல உத்தியுடன் ஒத்துப்போகிறது, இது 2013 இல் React இன் வெளியீடு மற்றும் 2016 இல் PyTorch இன் உருவாக்கம் ஆகியவற்றால் எடுத்துக்காட்டப்படுகிறது. வெற்றிகரமான சுற்றுச்சூழல் அமைப்புகளை வளர்ப்பதன் மூலம், Meta திறந்த மூல சமூகத்தின் பங்களிப்புகளிலிருந்து பயனடைகிறது.

Nate Jones குறிப்பிட்டபடி, Zuckerberg Meta-வின் திறந்த மூல முயற்சிகளிலிருந்து கணிசமான நன்மைகளைப் பெறுகிறார்.