GPT-4.5 தோல்வியா? OpenAI-யின் சமீபத்திய மாதிரி பற்றிய ஆழமான பார்வை

GPT-4.5-ன் அளவும் நோக்கமும்

GPT-4.5 என்பது OpenAI-யின் மிக முக்கியமான முயற்சியாகும், அதன் அளவு அடிப்படையில். அதன் கட்டமைப்பு மற்றும் பயிற்சி தரவு பற்றிய துல்லியமான விவரங்கள் குறைவாக இருந்தாலும், பயிற்சி செயல்முறை பல தரவு மையங்களில் விநியோகிக்கப்பட வேண்டிய அளவுக்கு கணக்கீட்டு ரீதியாக தீவிரமானது என்பது அறியப்படுகிறது. இது மட்டுமே அதன் உருவாக்கத்தில் கொட்டப்பட்ட நினைவுச்சின்ன வளங்களை சுட்டிக்காட்டுகிறது.

மாதிரியின் விலை அமைப்பு, ஒரு பிரீமியம் தயாரிப்பாக அதன் நிலையை மேலும் அடிக்கோடிட்டுக் காட்டுகிறது. செலவுகள் அதன் முன்னோடிகளை விட கணிசமாக அதிகமாக உள்ளன, GPT-4o ஐ விட 15-30 மடங்கு அதிகமாகவும், o1 ஐ விட 3-5 மடங்கு அதிகமாகவும், Claude 3.7 Sonnet ஐ விட 10-25 மடங்கு அதிகமாகவும் உள்ளது. அணுகல் தற்போது ChatGPT Pro சந்தாதாரர்களுக்கு (மாதத்திற்கு $200) மற்றும் டோக்கன் அடிப்படையில் பணம் செலுத்த விரும்பும் API கிளையண்டுகளுக்கு மட்டுமே கட்டுப்படுத்தப்பட்டுள்ளது.

இருப்பினும், செயல்திறன் ஆதாயங்கள், குறைந்தபட்சம் சில பகுதிகளில், விலைக் குறியுடன் சரியாகப் பொருந்தவில்லை. ஆரம்ப அளவுகோல்கள் GPT-4o ஐ விட மிதமான மேம்பாடுகளை மட்டுமே வெளிப்படுத்தின, மேலும் GPT-4.5 ஆனது o1 மற்றும் o3-mini போன்ற மாடல்களை விட பகுத்தறிவு பணிகளில் பின்தங்கியிருப்பதைக் காட்டியது.

GPT-4.5-ன் நோக்கம் கொண்ட நோக்கத்தைப் புரிந்துகொள்வது

OpenAI GPT-4.5 ஐ அதன் முதன்மை, அனைத்து நோக்கம் கொண்ட மாதிரியாக வெளிப்படையாக சந்தைப்படுத்தவில்லை என்பதை ஒப்புக்கொள்வது முக்கியம். உண்மையில், அவர்களின் வலைப்பதிவு இடுகையின் ஆரம்ப பதிப்புகள், இது திறனின் முழுமையான எல்லைகளைத் தள்ளும் ஒரு ‘முன்னணி மாதிரி’ அல்ல என்பதை தெளிவுபடுத்தியது. மேலும், இது முதன்மையாக ஒரு பகுத்தறிவு மாதிரியாக வடிவமைக்கப்படவில்லை, அதற்காக உகந்ததாக இருக்கும் மாடல்களுடன் (o3 மற்றும் DeepSeek-R1 போன்றவை) நேரடி ஒப்பீடுகளை ஓரளவு தவறாக வழிநடத்துகிறது.

GPT-4.5 ஆனது அதன் இறுதி சங்கிலி-சிந்தனை அல்லாத மாதிரியாக இருக்கும் என்று OpenAI சுட்டிக்காட்டியுள்ளது. இதன் பொருள் அதன் பயிற்சி பரந்த அளவிலான உலக அறிவை உட்பொதிப்பதிலும் பயனர் விருப்பங்களுடன் சீரமைப்பதிலும் அதிக கவனம் செலுத்தியது, சிக்கலான பகுத்தறிவு திறன்களை வளர்ப்பதை விட.

GPT-4.5 எங்கே பிரகாசிக்கக்கூடும்: அறிவும் நுணுக்கமும்

பெரிய மாடல்களின் முக்கிய நன்மை பெரும்பாலும் அறிவு கையகப்படுத்துவதற்கான அவற்றின் விரிவாக்கப்பட்ட திறனில் உள்ளது. GPT-4.5, இந்த கொள்கைக்கு ஏற்ப, அதன் சிறிய சகாக்களுடன் ஒப்பிடும்போது மாயத்தோற்றத்திற்கான குறைக்கப்பட்ட போக்கை நிரூபிக்கிறது. இது உண்மைகள் மற்றும் சூழ்நிலை தகவல்களை கண்டிப்பாக கடைபிடிப்பது மிக முக்கியமானது என்ற சூழ்நிலைகளில் மதிப்புமிக்கதாக அமைகிறது.

மேலும், GPT-4.5 பயனர் அறிவுறுத்தல்கள் மற்றும் விருப்பங்களைப் பின்பற்றும் மேம்பட்ட திறனை வெளிப்படுத்துகிறது. இது OpenAI மூலம் பல்வேறு ஆர்ப்பாட்டங்களில் காட்சிப்படுத்தப்பட்டுள்ளது மற்றும் ஆன்லைனில் பகிரப்பட்ட பயனர் அனுபவங்களால் உறுதிப்படுத்தப்பட்டுள்ளது. மாதிரி பயனர் நோக்கத்தின் நுணுக்கங்களை மிகவும் திறம்பட புரிந்துகொள்வதாகத் தெரிகிறது, இது மிகவும் பொருத்தமான மற்றும் தொடர்புடைய வெளியீடுகளுக்கு வழிவகுக்கிறது.

உரைநடை தரம் பற்றிய விவாதம்: அகநிலை மற்றும் சாத்தியம்

GPT-4.5 இன் சிறந்த உரைநடையை உருவாக்கும் திறன் குறித்து ஒரு கலகலப்பான விவாதம் எழுந்துள்ளது. சில OpenAI நிர்வாகிகள் மாதிரியின் வெளியீட்டு தரத்தை பாராட்டியுள்ளனர், CEO Sam Altman, அதனுடன் தொடர்புகொள்வது சில விவேகமான சோதனையாளர்களுக்கு ‘AGI’ (செயற்கை பொது நுண்ணறிவு) பற்றிய ஒரு பார்வையை வழங்கியதாகக் கூட பரிந்துரைத்தார்.

இருப்பினும், பரந்த எதிர்வினை கலவையாக உள்ளது. OpenAI இணை நிறுவனர் Andrej Karpathy, தூய பகுத்தறிவை குறைவாக நம்பியிருக்கும் பணிகளில் முன்னேற்றங்களை எதிர்பார்த்தார், ‘EQ’ (உணர்ச்சி நுண்ணறிவு), படைப்பாற்றல், ஒப்புமை உருவாக்கம் மற்றும் நகைச்சுவை போன்ற பகுதிகளை வலியுறுத்தினார் - பெரும்பாலும் உலக அறிவு மற்றும் பொதுவான புரிதல் ஆகியவற்றால் தடைபட்ட அம்சங்கள்.

சுவாரஸ்யமாக, Karpathy நடத்திய ஒரு கணக்கெடுப்பு, எழுத்துத் தரத்தைப் பொறுத்தவரை GPT-4.5 இன் பதில்களை விட GPT-4o இன் பதில்களுக்கு பொதுவான பயனர் விருப்பத்தை வெளிப்படுத்தியது. இது உரைநடையை மதிப்பிடுவதில் உள்ளார்ந்த அகநிலையை எடுத்துக்காட்டுகிறது மற்றும் திறமையான உடனடி பொறியியல் சிறிய, அதிக திறன் வாய்ந்த மாடல்களிலிருந்து ஒப்பிடக்கூடிய தரத்தைத் தூண்டக்கூடும் என்று கூறுகிறது.

Karpathy தானே முடிவுகளின் தெளிவின்மையை ஒப்புக்கொண்டார், பல்வேறு சாத்தியமான விளக்கங்களை பரிந்துரைத்தார்: ‘உயர்-சுவை’ சோதனையாளர்கள் மற்றவர்களால் தவறவிடப்பட்ட நுட்பமான கட்டமைப்பு மேம்பாடுகளை உணரலாம், சோதிக்கப்பட்ட எடுத்துக்காட்டுகள் சிறந்ததாக இருந்திருக்காது, அல்லது வேறுபாடுகள் ஒரு சிறிய மாதிரி அளவில் கண்டறிய முடியாத அளவுக்கு நுட்பமானதாக இருக்கலாம்.

அளவிடுதலின் வரம்புகள் மற்றும் LLM-களின் எதிர்காலம்

GPT-4.5 இன் வெளியீடு, சில அம்சங்களில், மிகப்பெரிய தரவுத்தொகுப்புகளில் பயிற்சி பெற்ற மாடல்களை அளவிடுவதன் சாத்தியமான வரம்புகளை அடிக்கோடிட்டுக் காட்டுகிறது. Ilya Sutskever, மற்றொரு OpenAI இணை நிறுவனர் மற்றும் முன்னாள் தலைமை விஞ்ஞானி, NeurIPS 2024 இல் பிரபலமாக கூறினார், ‘எங்களுக்குத் தெரிந்தபடி முன் பயிற்சி சந்தேகத்திற்கு இடமின்றி முடிவடையும்… நாங்கள் உச்ச தரவை அடைந்துவிட்டோம், இனி இருக்காது. எங்களிடம் உள்ள தரவை நாம் கையாள வேண்டும். ஒரே ஒரு இணையம் மட்டுமே உள்ளது.’

GPT-4.5 உடன் காணப்பட்ட குறைந்து வரும் வருமானம், முதன்மையாக இணையத் தரவுகளில் பயிற்சி பெற்ற பொது-நோக்க மாதிரிகளை அளவிடுவதன் சவால்களுக்கு ஒரு சான்றாக செயல்படுகிறது மற்றும் மனித பின்னூட்டத்திலிருந்து (RLHF) வலுவூட்டல் கற்றல் மூலம் சீரமைப்புக்காக நன்றாக வடிவமைக்கப்பட்டுள்ளது.

பெரிய மொழி மாதிரிகளுக்கான அடுத்த எல்லை சோதனை-நேர அளவிடுதல் (அல்லது அனுமான-நேர அளவிடுதல்) ஆகும். இது சங்கிலி-சிந்தனை (CoT) டோக்கன்களை உருவாக்குவதன் மூலம் நீண்ட காலத்திற்கு ‘சிந்திக்க’ மாடல்களுக்கு பயிற்சி அளிப்பதை உள்ளடக்குகிறது. சோதனை-நேர அளவிடுதல் ஒரு மாதிரியின் சிக்கலான பகுத்தறிவு சிக்கல்களைச் சமாளிக்கும் திறனை மேம்படுத்துகிறது மற்றும் o1 மற்றும் R1 போன்ற மாடல்களின் வெற்றிக்கு ஒரு முக்கிய காரணியாக உள்ளது.

தோல்வி அல்ல, ஆனால் ஒரு அடித்தளம்

GPT-4.5 ஒவ்வொரு பணிக்கும் உகந்த தேர்வாக இல்லாவிட்டாலும், எதிர்கால முன்னேற்றங்களுக்கான ஒரு அடித்தள உறுப்பாக அதன் சாத்தியமான பங்கை அங்கீகரிப்பது முக்கியம். மிகவும் நுட்பமான பகுத்தறிவு மாதிரிகளின் வளர்ச்சிக்கு ஒரு வலுவான அறிவுத் தளம் அவசியம்.

GPT-4.5 பெரும்பாலான பயன்பாடுகளுக்கான மாதிரியாக மாறவில்லை என்றாலும், அது அடுத்தடுத்த பகுத்தறிவு மாதிரிகளுக்கான ஒரு முக்கியமான கட்டுமானத் தொகுதியாக செயல்படும். o3 போன்ற மாடல்களுக்குள் இது ஏற்கனவே பயன்படுத்தப்பட்டு வருவது கூட நம்பத்தகுந்தது.

OpenAI-யின் தலைமை ஆராய்ச்சி அதிகாரி Mark Chen விளக்கியது போல், ‘பகுத்தறிவை உருவாக்க உங்களுக்கு அறிவு தேவை. ஒரு மாதிரி குருட்டுத்தனமாக சென்று புதிதாக பகுத்தறிவைக் கற்றுக்கொள்ள முடியாது. எனவே இந்த இரண்டு முன்னுதாரணங்களும் மிகவும் பாராட்டுக்குரியவை என்று நாங்கள் காண்கிறோம், மேலும் அவை ஒருவருக்கொருவர் பின்னூட்ட சுழல்களைக் கொண்டுள்ளன என்று நாங்கள் நினைக்கிறோம்.’

எனவே, GPT-4.5 இன் வளர்ச்சி, ஒரு முட்டுச்சந்தையை அல்ல, பெரிய மொழி மாதிரிகளின் தொடர்ச்சியான பரிணாம வளர்ச்சியில் ஒரு மூலோபாய படியைக் குறிக்கிறது. இது AI ஆராய்ச்சியின் மறு செய்கை தன்மைக்கு ஒரு சான்றாகும், அங்கு ஒவ்வொரு அடியும், தனிமையில் சாதாரணமாகத் தோன்றினாலும், அதிக திறன் வாய்ந்த மற்றும் பல்துறை AI அமைப்புகளை நோக்கிய பரந்த முன்னேற்றத்திற்கு பங்களிக்கிறது. தகவல்களை நினைவுபடுத்துவது மட்டுமல்லாமல், முன்னோடியில்லாத செயல்திறனுடன் சிக்கல்களை பகுத்தறிந்து தீர்க்கக்கூடிய மாடல்களை உருவாக்குவதில் இப்போது கவனம் செலுத்தப்படுகிறது. உண்மையிலேயே புத்திசாலித்தனமான AI நோக்கிய பயணம் தொடர்கிறது, மேலும் GPT-4.5, அதன் கலவையான வரவேற்பு இருந்தபோதிலும், அந்த பயணத்தில் ஒரு குறிப்பிடத்தக்க பங்கைக் கொண்டுள்ளது.
இப்போது கவனம் ஒரு மாதிரிக்கு எவ்வளவு தெரியும் என்பதில் மட்டுமல்ல, அந்த அறிவை அது எவ்வளவு சிறப்பாக பயன்படுத்த முடியும் என்பதிலும் உள்ளது. இது AI சமூகம் போராடி வரும் முக்கிய சவாலாகும், மேலும் GPT-4.5, ஒரு சரியான தீர்வாக இல்லாவிட்டாலும், மதிப்புமிக்க நுண்ணறிவுகளையும் எதிர்கால திருப்புமுனைகளுக்கு ஒரு திடமான அடித்தளத்தையும் வழங்குகிறது. முன்னோக்கி செல்லும் பாதையில் அணுகுமுறைகளின் கலவை உள்ளது: ஏற்கனவே உள்ள நுட்பங்களைச் செம்மைப்படுத்துதல், புதிய கட்டமைப்புகளை ஆராய்தல் மற்றும் பயிற்சி மற்றும் மதிப்பீட்டிற்கான மிகவும் நுட்பமான முறைகளை உருவாக்குதல். இறுதி இலக்கு அப்படியே உள்ளது: மனித மொழியைப் புரிந்துகொண்டு உருவாக்குவது மட்டுமல்லாமல், ஒரு காலத்தில் மனித நுண்ணறிவின் பிரத்யேக களமாகக் கருதப்பட்ட வழிகளில் பகுத்தறியவும், கற்றுக்கொள்ளவும், மாற்றியமைக்கவும் கூடிய AI அமைப்புகளை உருவாக்குவது.