OpenAI-யின் GPT-4.5: சுமாரான மேம்பாடுகளுடன் கூடிய விலையுயர்ந்த மேம்படுத்தல் | ta

செயல்திறன் மேம்பாடுகள்: ஒரு நெருக்கமான பார்வை

OpenAI-யின் அக அளவுகோல்கள், GPT-4.5 பல முக்கிய பகுதிகளில் GPT-4o-வை விட சிறப்பாக செயல்படுவதை வெளிப்படுத்துகின்றன. பன்மொழி MMMLU (பொது அறிவு) தேர்வில் அதன் செயல்திறன் ஒரு குறிப்பிடத்தக்க முன்னேற்றம் ஆகும். GPT-4.5 85.1% மதிப்பெண் பெற்றது, GPT-4o-வின் 81.5% ஐ விட அதிகமாகும். இது பல்வேறு மொழிகளில் பரந்த மற்றும் ஆழமான பொது அறிவைப் பரிந்துரைக்கிறது.

நிலையான சோதனைகளுக்கு அப்பால், GPT-4.5 ‘confabulations’ என்று பொதுவாக அறியப்படும் மாயத்தோற்றங்களைக் குறைப்பதாக OpenAI கூறுகிறது. இதன் பொருள் மாதிரி தவறான அல்லது தவறாக வழிநடத்தும் தகவல்களை உருவாக்குவது குறைவு, இது உண்மை துல்லியம் தேவைப்படும் பயன்பாடுகளுக்கு முக்கியமான முன்னேற்றமாகும். புனையப்பட்ட பதில்களின் குறைவான நிகழ்வுகள் அதிக நம்பகத்தன்மையை நோக்கிய ஒரு படியைக் குறிக்கின்றன.

பயனர் அனுபவமும் ஒரு ஊக்கத்தைப் பெறுகிறது, இருப்பினும் அது மிதமானது. OpenAI-யின் மதிப்பீடுகள், சுமார் 57% தொடர்புகளில் பயனர்கள் GPT-4o-வின் பதில்களை விட GPT-4.5-ன் பதில்களை விரும்புவதாகக் குறிப்பிடுகின்றன. இது ஒரு பெரிய வெற்றி இல்லையென்றாலும், இந்த விருப்பம் மாதிரியின் வெளியீட்டின் ஒட்டுமொத்த தரம் மற்றும் பொருத்தத்தில் ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தை பரிந்துரைக்கிறது. தொடர்புகள் மிகவும் இயல்பானதாகவும், பயனர் எதிர்பார்ப்புகளுடன் ஒத்துப்போவதாகவும் உணர்கின்றன.

எளிய QA துல்லியத்தில் மற்றொரு குறிப்பிடத்தக்க முன்னேற்றம் காணப்படுகிறது. இங்கே, GPT-4.5 62.5% மதிப்பெண் பெறுகிறது, இது GPT-4o-வின் 38.2% இலிருந்து கணிசமான அதிகரிப்பு. இது நேரடியான கேள்விகளுக்கு துல்லியமான பதில்களை வழங்குவதற்கான மாதிரியின் திறனில் குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது, மேம்பட்ட புரிதல் மற்றும் மீட்டெடுப்பு திறன்களைக் காட்டுகிறது.

உணர்ச்சி அளவு: மிகவும் மனிதனைப் போன்ற தொடர்பு

GPT-4.5 மூல செயல்திறன் அளவீடுகள் மூலம் மட்டுமல்லாமல், அதன் மேம்பட்ட உணர்ச்சி அளவு (EQ) மூலமாகவும் தன்னை வேறுபடுத்திக் கொள்கிறது. மாதிரி மிகவும் இயல்பான மற்றும் அனுதாபமான தொனியைப் பின்பற்றுவதற்காக வடிவமைக்கப்பட்டுள்ளது, இது தொடர்புகளை குறைவான ரோபோத்தனமாகவும் மேலும் ஈர்க்கக்கூடியதாகவும் ஆக்குகிறது. இது மனிதனைப் போன்ற AI-ஐ உருவாக்குவதற்கான ஒரு குறிப்பிடத்தக்க படியாகும்.

இயற்கையான தொனி: உரையாடல்கள் மிகவும் சீராக நடைபெறுகின்றன, பதில்கள் மனித உரையாடல் முறைகளை சிறப்பாகப் பின்பற்றுகின்றன.
அனுதாபமான பதில்கள்: உரையாடலின் உணர்ச்சிபூர்வமான தொனிகளைப் புரிந்துகொண்டு பதிலளிக்கும் திறனை மாதிரி நிரூபிக்கிறது.
ஈர்க்கும் தொடர்புகள்: ஒட்டுமொத்த அனுபவம் மிகவும் வசீகரிக்கும் வகையில் வடிவமைக்கப்பட்டுள்ளது, பயனரின் கவனத்தை ஈர்த்து, மேலும் நேர்மறையான தொடர்பை வளர்க்கிறது.

இந்த மேம்பட்ட EQ, மனிதனைப் போன்ற தொடர்பு மிக முக்கியமான பயன்பாடுகளுக்கு GPT-4.5 ஐ குறிப்பாகப் பொருத்தமானதாக ஆக்குகிறது. வாடிக்கையாளர் சேவை, மெய்நிகர் உதவியாளர்கள் மற்றும் சிகிச்சை பயன்பாடுகள் கூட இந்த நுணுக்கமான மற்றும் உணர்ச்சி ரீதியாக அறிவார்ந்த அணுகுமுறையால் பயனடையலாம்.

மேலும், GPT-4.5 ‘steerability’-ல் சிறந்து விளங்குகிறது. இது நுணுக்கமான அறிவுறுத்தல்களை அதிக துல்லியத்துடன் விளக்கி பதிலளிக்கும் மாதிரியின் திறனைக் குறிக்கிறது. GPT-4.5 நுட்பத்தை வலுவாகப் புரிந்துகொள்வதை பயனர்கள் கவனித்துள்ளனர், இது சிக்கலான அல்லது தெளிவற்ற வினவல்களை மிகவும் திறம்பட கையாள அனுமதிக்கிறது. இது ஒரு கேள்வியின் அடிப்படை நோக்கத்தை சிறப்பாகப் புரிந்துகொள்ள முடியும், இது மிகவும் பொருத்தமான மற்றும் பயனுள்ள பதில்களுக்கு வழிவகுக்கும்.

கவனிக்க வேண்டிய விஷயம்: விலை நிர்ணய கவலைகள்

முன்னேற்றங்கள் இருந்தபோதிலும், GPT-4.5-ன் விலை நிர்ணயம் ஒரு முக்கிய சர்ச்சைக்குரிய விஷயமாக மாறியுள்ளது. இது GPT-4o-வை விட மேம்பாடுகளை வழங்கினாலும், செலவு வேறுபாடு கணிசமானது. உள்ளீட்டு செயலாக்கத்திற்கு, GPT-4.5 தோராயமாக 30 மடங்கு அதிக விலை கொண்டது, மற்றும் வெளியீடு உருவாக்கத்திற்கு, இது 15 மடங்கு அதிக விலை கொண்டது. இந்த விலை நிர்ணய மாதிரி புதிய மாதிரியின் மதிப்பு முன்மொழிவு குறித்து தீவிர கேள்விகளை எழுப்புகிறது.

முக்கிய பிரச்சனை குறைந்து வரும் வருமானம். GPT-4.5 சந்தேகத்திற்கு இடமின்றி அதன் முன்னோடியை விட பெரியது மற்றும் சிக்கலானது என்றாலும், செயல்திறன் மேம்பாடுகள் செலவு அதிகரிப்புக்கு விகிதாசாரமாக அதிகரிக்கவில்லை. இந்த முரண்பாடு AI சமூகத்தில் பலரை, இந்த சிறிய ஆதாயங்கள் அதிவேக விலை உயர்வை நியாயப்படுத்துகிறதா என்று கேள்வி எழுப்ப வழிவகுத்தது.

அதிகப்படியான விலை நிர்ணயம் அணுகலில் குறிப்பிடத்தக்க தாக்கங்களை ஏற்படுத்துகிறது. பல டெவலப்பர்கள், குறிப்பாக சுயாதீனமாக அல்லது சிறிய வணிகங்களுக்கு வேலை செய்பவர்கள், GPT-4.5 ஐ அடைய முடியாததாகக் காணலாம். இது நுழைவதற்கான தடையை உருவாக்குகிறது, புதுமைகளைத் தடுக்கிறது மற்றும் தொழில்நுட்பத்தின் பரவலான பயன்பாட்டைக் கட்டுப்படுத்துகிறது.

ஒரு நடைமுறை உதாரணத்தைக் கவனியுங்கள்: 300,000 வார்த்தைகள் கொண்ட நாவலை (தோராயமாக 450,000 டோக்கன்கள்) சுருக்கி, 50,000 டோக்கன் பகுப்பாய்வு அறிக்கையை உருவாக்குதல். GPT-4.5 உடன், இந்த பணிக்கு தோராயமாக $41.25 செலவாகும். GPT-4 ஐப் பயன்படுத்தி அதே பணிக்கு வெறும் $1.6 செலவாகும். இந்த கடுமையான வேறுபாடு GPT-4.5 பயனர்கள் மீது, குறிப்பாக பெரிய அளவிலான திட்டங்களுக்கு வைக்கும் நிதிச் சுமையை எடுத்துக்காட்டுகிறது.

இந்த விலை நிர்ணய உத்தி AI மேம்பாட்டு நிலப்பரப்பில் மலிவு மற்றும் உள்ளடக்கம் குறித்த கவலைகளை எழுப்புகிறது. சிறிய நிறுவனங்கள் மற்றும் தனிப்பட்ட ஆராய்ச்சியாளர்கள் குறைவான விலையுள்ள, ஆனால் குறைவான சக்திவாய்ந்த மாற்றுகளைத் தேர்வு செய்ய வேண்டிய கட்டாயத்தில் இருக்கலாம், இது பிரீமியம் செலவை வாங்கக்கூடிய பெரிய நிறுவனங்களுடன் போட்டியிடும் திறனைத் தடுக்கலாம்.

பகுத்தறியும் திறன்கள்: முன்னேற்றத்தில் உள்ள ஒரு பணி

GPT-4.5 பல பகுதிகளில் முன்னேற்றங்களைக் காட்டினாலும், அதன் வரம்புகளை ஒப்புக்கொள்வது முக்கியம். மாதிரி முன் பயிற்சி, மேற்பார்வையிடப்பட்ட நுணுக்கமான சரிசெய்தல் மற்றும் மனித பின்னூட்டத்திலிருந்து வலுவூட்டல் கற்றல் (RLHF) ஆகியவற்றைப் பயன்படுத்தி உருவாக்கப்பட்டது. இருப்பினும், இது இன்னும் மேம்பட்ட பகுத்தறிவு பணிகளுக்கு உகந்ததாக இல்லை.

இதன் பொருள் தற்போதைய வெளியீடு கணிதம் மற்றும் குறியீட்டு முறை போன்ற வலுவான பகுத்தறிவு திறன்களை பெரிதும் நம்பியிருக்கும் களங்களில் குறிப்பிடத்தக்க முன்னேற்றங்களைக் கொண்டு வரவில்லை. இந்த பகுதிகளுக்கு GPT-4.5, அதன் தற்போதைய நிலையில், முழுமையாக இல்லாத ஆழமான தர்க்கரீதியான விலக்கு மற்றும் சிக்கல் தீர்க்கும் திறன் தேவைப்படுகிறது.

வலுவான பகுத்தறிவு திறன்கள் தேவைப்படும் பணிகளுக்கு, GPT-4o முன்னணி மாதிரியாக உள்ளது. OpenAI-யின் உத்தி ஒரு கட்ட அணுகுமுறையை உள்ளடக்கியதாகத் தெரிகிறது, GPT-4.5-ன் ஆரம்ப வெளியீடு பொது அறிவு, பயனர் அனுபவம் மற்றும் உணர்ச்சி நுண்ணறிவு போன்ற பகுதிகளில் கவனம் செலுத்துகிறது. நிறுவனம் அதன் கவனத்தை GPT-4.5-க்கு கூடுதல் RL பயிற்சியைப் பயன்படுத்துவதில் கவனம் செலுத்தக்கூடும், குறிப்பாக அதன் பகுத்தறியும் திறன்களை மேம்படுத்துவதற்காக. இது தொடர்ச்சியான முன்னேற்றத்திற்கான அர்ப்பணிப்பைக் குறிக்கிறது, எதிர்கால புதுப்பிப்புகள் பகுத்தறிவு-தீவிர பணிகளில் உள்ள தற்போதைய வரம்புகளை நிவர்த்தி செய்யும்.
எதிர்கால மேம்பாடுகள் இடைவெளியைக் குறைக்கும், இறுதியில் GPT-4.5 ஐ பகுத்தறிவு அடிப்படையிலான பயன்பாடுகளிலும் முன்னணியில் வைக்கும் என்று எதிர்பார்க்கப்படுகிறது.

ஒட்டுமொத்தமாக:

GPT-4.5-ன் வெளியீடு ஒரு சிக்கலான படத்தை முன்வைக்கிறது. இது சில பகுதிகளில், குறிப்பாக பயனர் அனுபவம் மற்றும் உணர்ச்சி நுண்ணறிவு ஆகியவற்றில் முன்னேற்றங்களைக் காட்டுகிறது. இருப்பினும், விலை நிர்ணய மாதிரி அணுகல் மற்றும் ஒட்டுமொத்த மதிப்பு முன்மொழிவு குறித்து குறிப்பிடத்தக்க கவலைகளை எழுப்புகிறது. மாதிரி ஒரு படி முன்னேற்றத்தைக் குறிக்கும் அதே வேளையில், அதன் செலவு-செயல்திறன் AI சமூகத்தில் விவாதத்திற்குரிய ஒரு விஷயமாகவே உள்ளது. பகுத்தறியும் திறன்களில் உள்ள வரம்புகள் நடந்து கொண்டிருக்கும் மேம்பாட்டு செயல்முறையை எடுத்துக்காட்டுகின்றன, எதிர்கால புதுப்பிப்புகள் இந்த குறைபாடுகளை நிவர்த்தி செய்யும் என்று எதிர்பார்க்கப்படுகிறது. GPT-4.5-ன் பாதை OpenAI செயல்திறன், செலவு மற்றும் அணுகல் ஆகியவற்றுக்கு இடையேயான சமநிலையை எவ்வாறு வழிநடத்துகிறது என்பதைப் பொறுத்தது, இறுதியில் பரந்த AI நிலப்பரப்பில் அதன் தாக்கத்தை தீர்மானிக்கிறது.

புதுப்பிக்கப்பட்டது ௨௦௨௫-௦௩-௧௧

# AIGC # OpenAI # GPT