பெரிய மொழி மாதிரிகளின் (LLMs) களம் ஒரு குறிப்பிடத்தக்க மாற்றத்தைக் கண்டுள்ளது. கூகிள் ஒரு முக்கிய வீரராக உருவெடுத்துள்ளது, அதே நேரத்தில் Meta மற்றும் OpenAI குறிப்பிடத்தக்க சவால்களை எதிர்கொள்கின்றன. ஆரம்பத்தில், OpenAI அதன் முன்னோடியான GPT மாதிரிகள் மூலம் இந்தத் துறையில் ஆதிக்கம் செலுத்தியது, LLM செயல்திறனுக்கான புதிய தரநிலைகளை அமைத்தது. Meta அதன் திறந்த எடை மாதிரிகளை வழங்குவதன் மூலம் கணிசமான இடத்தை உறுதி செய்தது. அவை ஈர்க்கக்கூடிய திறன்களைக் கொண்டிருந்தன மற்றும் அவர்களின் பொதுவில் அணுகக்கூடிய குறியீட்டின் கட்டுப்பாடற்ற பயன்பாடு, மாற்றம் மற்றும் வரிசைப்படுத்தலை அனுமதித்தன.
இருப்பினும், கூகிள் உள்ளிட்ட மற்ற தொழில்நுட்ப நிறுவனங்கள் இந்த ஆரம்ப ஆதிக்கத்தால் பின்தங்கின. LLMகளுக்கு அடிப்படையாக இருக்கும் டிரான்ஸ்பார்மர் கட்டிடக்கலை பற்றிய கூகிளின் 2017 முக்கிய ஆராய்ச்சி கட்டுரை இருந்தபோதிலும், நிறுவனத்தின் ஆரம்ப முயற்சிகள் 2023 இல் பார்டின் பரவலாக விமர்சிக்கப்பட்ட வெளியீட்டால் மறைக்கப்பட்டன.
சமீபத்தில், கூகிளிடமிருந்து சக்திவாய்ந்த புதிய LLMகளின் அறிமுகத்துடன், Meta மற்றும் OpenAI அனுபவித்த பின்னடைவுகளுடன் இணைந்து அலைகள் திரும்பியுள்ளன. இந்த மாற்றம் LLM நிலப்பரப்பின் இயக்கவியலை கணிசமாக மாற்றியுள்ளது.
Metaவின் Llama 4: ஒரு தவறா?
ஏப்ரல் 5 சனிக்கிழமையன்று Metaவின் Llama 4 இன் எதிர்பாராத வெளியீடு தொழில் முழுவதும் புருவங்களை உயர்த்தியது.
ஒரு பெரிய மாதிரியை வார இறுதியில் தொடங்க முடிவு செய்தது வழக்கத்திற்கு மாறானதாகக் கருதப்பட்டது. இது ஒரு அமைதியான வரவேற்புக்கு வழிவகுத்தது மற்றும் அடுத்த வார செய்திகளின் ஓட்டத்தில் அறிவிப்பை மறைத்தது.
Llama 4 சில பலங்களைக் கொண்டிருந்தாலும், அதன் மல்டிமாடல் திறன்கள் (படங்கள், ஆடியோ மற்றும் பிற முறைகளைக் கையாளுதல்) மற்றும் மாறுபட்ட அளவுகள் மற்றும் பலங்களுடன் மூன்று பதிப்புகளில் (Llama 4 Behemoth, Maverick மற்றும் Scout) கிடைப்பது உட்பட, அதன் வெளியீடு விமர்சனங்களைச் சந்தித்தது. குறிப்பாக Llama 4 Scout பதிப்பு, 10 மில்லியன் டோக்கன்கள் வரையிலான ஒரு பெரிய சூழல் சாளரத்தைக் கொண்டுள்ளது, இது மாடல் ஒரே அமர்வில் அதிக அளவிலான உரையைச் செயலாக்க மற்றும் உருவாக்க உதவுகிறது.
இருப்பினும், LMArena இல் Metaவின் தரவரிசை அணுகுமுறை தொடர்பாக முரண்பாடுகள் வெளிப்பட்டபோது, மாடலின் வரவேற்பு புளித்துப்போனது. LMArena என்பது பயனர்களின் வாக்குகளின் அடிப்படையில் LLMகளை தரவரிசைப்படுத்தும் ஒரு தளமாகும். தரவரிசைக்கு பயன்படுத்தப்பட்ட குறிப்பிட்ட Llama 4 மாதிரி பொது மக்களுக்குக் கிடைக்கக்கூடிய மாதிரியிலிருந்து வேறுபட்டது என்பது கண்டுபிடிக்கப்பட்டது. Meta “மனித விருப்பத்திற்கு உகந்ததாக இருக்க ஒரு தனிப்பயனாக்கப்பட்ட மாதிரியை” வழங்கியதாக LMArena கூறியது.
மேலும், Llama 4 Scout இன் 10 மில்லியன் டோக்கன் சூழல் சாளரம் தொடர்பான Metaவின் கூற்றுக்கள் சந்தேகம் கலந்தன. இந்த புள்ளிவிவரத்தின் தொழில்நுட்ப துல்லியம் இருந்தபோதிலும், நீண்ட சூழல் செயல்திறனில் Llama 4 போட்டியிடும் மாடல்களை விட பின்தங்கியிருப்பது தரப்படுத்தல்கள் மூலம் தெரியவந்தது.
கவலைகளைச் சேர்க்கும் வகையில், Meta ஒரு Llama 4 “காரணம்” அல்லது “சிந்தனை” மாதிரியை வெளியிடவில்லை மற்றும் சிறிய மாறுபாடுகளை நிறுத்தி வைத்தது, இருப்பினும் நிறுவனம் ஒரு காரண மாதிரியை வெளியிட இருப்பதாகக் கூறியுள்ளது.
AI ஆலோசனை நிறுவனமான Gradient Flowவின் நிறுவனரானபென் லோரிகா, Meta ஒரு முறையான வெளியீட்டின் நிலையான நடைமுறையிலிருந்து விலகியதாகக் குறிப்பிட்டார், அங்கு அனைத்து கூறுகளும் முழுமையாகத் தயாராக உள்ளன. ஒரு காரணம் மாதிரி மற்றும் சிறிய பதிப்புகள் போன்ற அத்தியாவசிய கூறுகள் இல்லாதபோதும், Meta ஒரு புதிய மாதிரியை காட்சிப்படுத்த ஆர்வமாக இருந்திருக்கலாம் என்று இது அறிவுறுத்துகிறது.
OpenAIயின் GPT-4.5: ஒரு முன்கூட்டிய பின்வாங்கல்
OpenAI சமீபத்திய மாதங்களில் சவால்களை எதிர்கொண்டுள்ளது.
GPT-4.5 பிப்ரவரி 27 அன்று ஒரு ஆராய்ச்சி முன்னோட்டமாக வெளியிடப்பட்டது, இது நிறுவனத்தின் ‘சாட் செய்வதற்கான மிகப்பெரிய மற்றும் சிறந்த மாதிரி’ என்று கூறப்படுகிறது. OpenAI தரப்படுத்தல்கள் GPT-4.5 பொதுவாக அதன் முன்னோடியான GPT-4o ஐ விட சிறப்பாக செயல்பட்டது என்று குறிப்பிடுகின்றன.
இருப்பினும், மாடலின் விலை அமைப்பு விமர்சனங்களை ஈர்த்தது. OpenAI API அணுகல் விலையை ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு US$150 ஆக நிர்ணயித்தது, இது GPT-4o இன் ஒரு மில்லியன் டோக்கன்களுக்கான $10 விலையை விட 15 மடங்கு அதிகமாகும். டெவலப்பர்கள் தங்கள் பயன்பாடுகள் மற்றும் சேவைகளில் OpenAI மாதிரிகளை ஒருங்கிணைக்க API உதவுகிறது.
Life Architect இல் AI ஆலோசகரும் ஆய்வாளருமான ஆலன் டி. தாம்சன், GPT-4.5 ஆனது 2025 முதல் காலாண்டில் வெளியிடப்பட்ட மிகப்பெரிய பாரம்பரிய LLM ஆக இருக்கலாம் என்று மதிப்பிட்டுள்ளார். இது தோராயமாக 5.4 டிரில்லியன் அளவுருக்களைக் கொண்டுள்ளது. தற்போதைய வன்பொருள் வரம்புகளைக் கருத்தில் கொண்டு இவ்வளவு பெரிய அளவை நியாயப்படுத்துவது கடினம் என்றும், ஒரு பெரிய பயனர் தளத்திற்கு சேவை செய்வதில் இது குறிப்பிடத்தக்க சவால்களை முன்வைக்கிறது என்றும் அவர் வாதிட்டார்.
ஏப்ரல் 14 அன்று, API வழியாக GPT-4.5 அணுகலை மூன்று மாதங்களுக்கும் குறைவான காலத்தில் நிறுத்துவதாக OpenAI அறிவித்தது. GPT-4.5 அணுகக்கூடியதாக இருந்தாலும், ChatGPT இடைமுகம் மூலம் ChatGPT பயனர்களுக்கு மட்டுமே இது கட்டுப்படுத்தப்படும்.
இந்த அறிவிப்பு GPT-4.1 இன் அறிமுகத்துடன் ஒத்துப்போனது, இது ஒரு மில்லியனுக்கு $8 என்ற விலையில் மிகவும் சிக்கனமான மாதிரி. OpenAI இன் தரப்படுத்தல்கள் GPT-4.1 ஒட்டுமொத்தமாக GPT-4.5 ஐப் போல திறமையானது அல்ல என்று குறிப்பிடுகின்றன, இருப்பினும் இது சில குறியீட்டு தரப்படுத்தல்களில் சிறந்த செயல்திறனைக் காட்டுகிறது.
OpenAI சமீபத்தில் புதிய காரண மாதிரிகளான o3 மற்றும் o4-mini ஐ வெளியிட்டது, o3 மாதிரி குறிப்பாக வலுவான தரப்படுத்தல் செயல்திறனைக் காட்டுகிறது. இருப்பினும், செலவு ஒரு கவலையாகவே உள்ளது, ஏனெனில் o3 க்கான API அணுகல் ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $40 ஆக விலை நிர்ணயம் செய்யப்பட்டுள்ளது.
கூகிளின் ஏற்றம்: வாய்ப்பைப் பயன்படுத்திக் கொள்வது
Llama 4 மற்றும் ChatGPT-4.5 இன் கலவையான வரவேற்பு போட்டியாளர்களுக்கு மூலதனமாக்க ஒரு திறப்பை உருவாக்கியது, மேலும் அவர்கள் அந்த வாய்ப்பைப் பயன்படுத்திக் கொண்டனர்.
Llama 4 இன் Metaவின் சிக்கலான வெளியீடு டெவலப்பர்களை DeepSeek-V3, Google இன் Gemma மற்றும் Alibaba வின் Qwen2.5 போன்ற மாற்றுகளை ஏற்றுக்கொள்ள ஊக்கமளிக்க வாய்ப்பில்லை. இந்த LLMகள் 2024 இன் பிற்பகுதியில் அறிமுகப்படுத்தப்பட்டன. அவை LMArena மற்றும் HuggingFace தலைவர் பலகைகளில் விருப்பமான திறந்த எடை மாதிரிகளாக மாறிவிட்டன. அவை பிரபலமான தரப்படுத்தல்களில் Llama 4 ஐ விட போட்டியிடுகின்றன அல்லது மிஞ்சுகின்றன, மலிவு விலையில் API அணுகலை வழங்குகின்றன. சில சந்தர்ப்பங்களில் நுகர்வோர் தர வன்பொருளில் பதிவிறக்கம் செய்து பயன்படுத்தவும் கிடைக்கின்றன.
இருப்பினும், கூகிளின் அதிநவீன LLM, Gemini 2.5 Pro தான் உண்மையாக கவனத்தை ஈர்த்துள்ளது.
மார்ச் 25 அன்று தொடங்கப்பட்ட Google Gemini 2.5 Pro ஆனது GPT-o1 மற்றும் DeepSeek-R1 ஐப் போன்ற ஒரு ‘சிந்தனை மாதிரி’. இது பணிகளைச் செய்ய சுய தூண்டுதலைப் பயன்படுத்துகிறது. Gemini 2.5 Pro மல்டிமாடல் ஆகும், ஒரு மில்லியன் டோக்கன்களின் சூழல் சாளரத்தைக் கொண்டுள்ளது மற்றும் ஆழமான ஆராய்ச்சியை ஆதரிக்கிறது.
Gemini 2.5 விரைவாக SimpleBench இல் முதலிடம் உட்பட தரப்படுத்தல் வெற்றிகளைப் பெற்றுள்ளது (ஏப்ரல் 16 அன்று OpenAI இன் o3 க்கு அந்த இடத்தை விட்டுக்கொடுத்தது) மற்றும் Artificial Analysis இன் ஒருங்கிணைந்த AI நுண்ணறிவு குறியீட்டில் முதல் இடத்தைப் பிடித்தது. Gemini 2.5 Pro தற்போது LMArena இல் முதலிடத்தில் உள்ளது. ஏப்ரல் 14 நிலவரப்படி, Google மாதிரிகள் LMArena இல் முதல் 10 இடங்களில் 5 இடங்களை ஆக்கிரமித்துள்ளன. Gemini 2.5 Pro, Gemini 2.0 இன் மூன்று வகைகள் மற்றும் Gemma 3-27B ஆகியவை அடங்கும்.
அதன் ஈர்க்கக்கூடிய செயல்திறனைத் தவிர, கூகிள் ஒரு விலை முன்னணியாளராகவும் உள்ளது. Google Gemini 2.5 தற்போது Google இன் Gemini பயன்பாடு மற்றும் Google இன் AI Studio இணையதளம் மூலம் இலவசமாகப் பயன்படுத்தக் கிடைக்கிறது. கூகிளின் API விலையும் போட்டித்தன்மை வாய்ந்தது. Gemini 2.5 Pro ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $10 ஆகவும், Gemini 2.0 Flash ஒரு மில்லியன் டோக்கன்களுக்கு 40 சென்ட் ஆகவும் விலை நிர்ணயம் செய்யப்பட்டுள்ளது.
அதிக அளவு காரண பணிகளுக்கு, தான் பெரும்பாலும் DeepSeek-R1 அல்லது Google Gemini ஐத் தேர்ந்தெடுப்பதாகவும், அதே நேரத்தில் OpenAI மாதிரிகளைப் பயன்படுத்தும் போது விலையை கவனமாகக் கருத்தில் கொள்ள வேண்டும் என்றும் லோரிகா குறிப்பிடுகிறார்.
Meta மற்றும் OpenAI ஆகியவை சரிவின் விளிம்பில் இல்லை என்றாலும், ChatGPT இன் பிரபலத்திலிருந்து OpenAI பயனடைகிறது. இது ஒரு பில்லியன் பயனர்களைக் கொண்டுள்ளது என்று கூறப்படுகிறது. ஆயினும்கூட, ஜெமினியின் வலுவான தரவரிசை மற்றும் தரப்படுத்தல் செயல்திறன் LLM நிலப்பரப்பில் ஒரு மாற்றத்தைக் குறிக்கிறது, இது தற்போது கூகிளுக்கு சாதகமாக உள்ளது.