கூகிள் மேம்பட்ட AI அணுகலை விரிவுபடுத்துகிறது: ஜெமினி 1.5 ப்ரோ | ta

செயற்கை நுண்ணறிவு மேலாதிக்கத்திற்கான பந்தயம் வேகமாக அதிகரித்து வரும் நிலையில், Google LLC ஒரு குறிப்பிடத்தக்க மூலோபாய நகர்வை மேற்கொண்டுள்ளது. தொழில்நுட்ப நிறுவனமான இது சமீபத்தில் அதன் மிகவும் அதிநவீன பெரிய மொழி மாதிரிகளில் (LLMs) ஒன்றான Gemini 1.5 Pro, வரையறுக்கப்பட்ட, சோதனை கட்டத்திலிருந்து பொது முன்னோட்டத்திற்கு மாறுவதாக அறிவித்தது. இந்த மாற்றம் ஒரு முக்கிய தருணத்தைக் குறிக்கிறது, இது மாதிரியின் திறன்களில் Google-இன் நம்பிக்கையையும், அதிநவீன AI-ஐப் பயன்படுத்த ஆர்வமுள்ள டெவலப்பர்கள் மற்றும் வணிகங்களால் பரவலாக ஏற்றுக்கொள்ளத் தயாராக இருப்பதையும் குறிக்கிறது. முன்னர் ஒரு கட்டுப்படுத்தப்பட்ட இலவச அடுக்கில் அடைக்கப்பட்டிருந்த, வலுவான கட்டண விருப்பங்களுடன் கூடிய விரிவாக்கப்பட்ட அணுகல், Gemini 1.5 Pro-வின் திறனைத் திறந்து, கோரும், நிஜ-உலகப் பயன்பாடுகளின் புதிய தலைமுறைக்கு சக்தி அளிக்கிறது. இது ஒரு தயாரிப்பு புதுப்பிப்பை விட மேலானது; இது கடுமையான போட்டி மற்றும் இடைவிடாத புதுமைகளால் வகைப்படுத்தப்படும் சந்தையில் நோக்கத்தின் தெளிவான அறிக்கை.

கட்டுப்படுத்தப்பட்ட சோதனையிலிருந்து வணிக சேவை வரை

Gemini 1.5 Pro-வின் பொது முன்னோட்டப் பயணம், முக்கிய தொழில்நுட்ப நிறுவனங்களால் உருவாக்கப்பட்ட மேம்பட்ட AI மாதிரிகளின் வழக்கமான வாழ்க்கைச் சுழற்சியை எடுத்துக்காட்டுகிறது. ஆரம்பத்தில், அணுகல் ஒரு இலவச Application Programming Interface (API) மூலம் கவனமாக நிர்வகிக்கப்பட்டது. இது டெவலப்பர்களுக்கு மாதிரியின் திறமையின் சுவையை அனுமதித்தாலும், இது முழு அளவிலான வரிசைப்படுத்தலை விட முதன்மையாக சோதனை மற்றும் ஆய்வுக்காக வடிவமைக்கப்பட்ட கடுமையான வரம்புகளுடன் வந்தது. பயன்பாடு ஒரு நாளைக்கு வெறும் 25 கோரிக்கைகளில் மூடப்பட்டது, நிமிடத்திற்கு ஐந்து கோரிக்கைகள் மட்டுமே என்ற செயல்திறன் வரம்புடன். இத்தகைய கட்டுப்பாடுகள், ஆரம்ப மதிப்பீட்டிற்கு பயனுள்ளதாக இருந்தாலும், கணிசமான பயனர் தளங்களுக்கு சேவை செய்யும் அல்லது அதிக அதிர்வெண் செயலாக்கம் தேவைப்படும் பயன்பாடுகளில் Gemini 1.5 Pro-வை ஒருங்கிணைப்பதைத் திறம்பட தடுத்தன.

பொது முன்னோட்டத்தின் அறிமுகம் இந்த நிலப்பரப்பை அடிப்படையில் மாற்றுகிறது. Google இப்போது உற்பத்தி சூழல்களுக்காக பிரத்யேகமாக வடிவமைக்கப்பட்ட கட்டண அடுக்குகளை வழங்குகிறது. இந்த வணிகச் சலுகை டெவலப்பர்களுக்குக் கிடைக்கும் செயல்பாட்டுத் திறனை வியத்தகு முறையில் அதிகரிக்கிறது. புதிய விகித வரம்புகள் கணிசமாக அதிகமாக உள்ளன, இது நிமிடத்திற்கு 2,000 கோரிக்கைகள் வரை அனுமதிக்கிறது. ஒருவேளை இன்னும் முக்கியமாக, தினசரி கோரிக்கை அதிகபட்சம் முற்றிலும் அகற்றப்பட்டது. இந்த மாற்றம் Gemini 1.5 Pro-வை ஒரு சுவாரஸ்யமான தொழில்நுட்ப கலைப்பொருளிலிருந்து, கோரும் பணிச்சுமைகள் மற்றும் அதிக எண்ணிக்கையிலான ஒரே நேரத்தில் பயனர்களைக் கொண்ட பயன்பாடுகளை ஆதரிக்கும் திறன் கொண்ட ஒரு சாத்தியமான வணிகக் கருவியாக மாற்றுகிறது. மாதிரியின் உள்கட்டமைப்பு இந்த அதிகரித்த தேவையைக் கையாள தெளிவாக அளவிடப்பட்டுள்ளது, இது Google-இன் குறிப்பிடத்தக்க முதலீட்டைக் குறிக்கிறது. மேலும், இந்த மாதிரி நிமிடத்திற்கு 8 மில்லியன் டோக்கன்கள் மதிப்புள்ள தரவைச் செயலாக்கும் ஈர்க்கக்கூடிய திறனைக் கொண்டுள்ளது, இது பல நிறுவன பயன்பாடுகளுக்கு முக்கியமான உயர்-செயல்திறன் பணிகளுக்கான அதன் திறனை அடிக்கோடிட்டுக் காட்டுகிறது. பெரிய ஆவண பகுப்பாய்வு, சிக்கலான தரவு ஓடைகள் அல்லது விரைவான பதில்கள் தேவைப்படும் ஊடாடும் அமைப்புகள் சம்பந்தப்பட்ட காட்சிகள் இதில் அடங்கும்.

மேம்பட்ட AI-இன் பொருளாதாரத்தை வழிநடத்துதல்

மேம்பட்ட திறனுடன் ஒரு புதிய விலை அமைப்பு வருகிறது. Google, Gemini 1.5 Pro-வின் பொது முன்னோட்டத்திற்கான ஒரு அடுக்கு அணுகுமுறையை கோடிட்டுக் காட்டியுள்ளது, இது உள்ளீட்டின் சிக்கலுடன் நேரடியாக செலவை இணைக்கிறது, இது டோக்கன்களில் அளவிடப்படுகிறது - LLM-கள் செயலாக்கும் தரவின் அடிப்படை அலகுகள் (எழுத்துக்கள் அல்லது சொற்கள் போன்றவை).

128,000 டோக்கன்கள் வரை உள்ள ப்ராம்ப்ட்களுக்கு, பல சிக்கலான பணிகளுக்குப் போதுமான ஒரு சூழல் சாளரம், செலவு 1 மில்லியன் உள்ளீட்டுடோக்கன்களுக்கு $7 ஆகவும், 1 மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $21 ஆகவும் நிர்ணயிக்கப்பட்டுள்ளது. உள்ளீட்டு டோக்கன்கள் மாதிரிக்கு ஊட்டப்பட்ட தரவைக் குறிக்கின்றன (ஒரு கேள்வி அல்லது ஒரு ஆவணம் போன்றவை), அதே நேரத்தில் வெளியீட்டு டோக்கன்கள் மாதிரியால் உருவாக்கப்பட்ட பதிலைக் குறிக்கின்றன.
ப்ராம்ப்ட் அளவு இந்த 128,000-டோக்கன் வரம்பை மீறும் போது, மாதிரியின் குறிப்பிடத்தக்க நீண்ட-சூழல் திறன்களைத் தட்டும்போது, விலை அதிகரிக்கிறது. இந்த பெரிய உள்ளீடுகளுக்கு, டெவலப்பர்களிடம் 1 மில்லியன் உள்ளீட்டு டோக்கன்களுக்கு $14 மற்றும் 1 மில்லியன் வெளியீட்டு டோக்கன்களுக்கு $42 வசூலிக்கப்படும்.

இந்த விலை நிர்ணயம் Gemini 1.5 Pro-வை உயர்நிலை AI மாதிரிகளின் போட்டி ஸ்பெக்ட்ரமிற்குள் வைக்கிறது. Google-இன் நிலைப்பாட்டின்படி, இது DeepSeek-V2 போன்ற சில வளர்ந்து வரும் திறந்த மூல மாற்றுகளுடன் ஒப்பிடும்போது மிகவும் பிரீமியம் விருப்பமாக உள்ளது, ஆனால் Anthropic PBC-இன் Claude 3 குடும்பத்தின் சில உள்ளமைவுகளை விட செலவு குறைந்த தீர்வை வழங்கக்கூடும், குறிப்பாக Claude 3.5 Sonnet-ஐ விட மலிவானது என்று குறிப்பிடப்பட்டுள்ளது (சந்தை ஒப்பீடுகள் நிலையற்றவை மற்றும் குறிப்பிட்ட பயன்பாட்டு வழக்குகள் மற்றும் செயல்திறன் அளவுகோல்களைப் பெரிதும் சார்ந்துள்ளது).

Google மூத்த தயாரிப்பு மேலாளர் Logan Kilpatrick வலியுறுத்தியது போல், Gemini 1.5 Pro-வின் சோதனை பதிப்பு இன்னும் கிடைக்கிறது என்பதைக் கவனத்தில் கொள்ள வேண்டியது அவசியம். இந்த இலவச அடுக்கு, அதன் கணிசமாக குறைந்த விகித வரம்புகளுடன் இருந்தாலும், உடனடி செலவுகளைச் செய்யாமல் பரிசோதனை மற்றும் முன்மாதிரி செய்ய விரும்பும் டெவலப்பர்கள், ஆராய்ச்சியாளர்கள் மற்றும் ஸ்டார்ட்அப்களுக்கு மதிப்புமிக்க நுழைவுப் புள்ளியைத் தொடர்ந்து வழங்குகிறது. இந்த இரட்டை அணுகுமுறை Google-ஐ சந்தையின் இரு முனைகளுக்கும் சேவை செய்ய அனுமதிக்கிறது - அடிமட்ட அளவில் புதுமைகளை வளர்ப்பது மற்றும் வணிக வரிசைப்படுத்தலுக்கு வலுவான, அளவிடக்கூடிய தீர்வை வழங்குவது. விலை நிர்ணய உத்தி, அத்தகைய சக்திவாய்ந்த மாதிரியை இயக்கத் தேவையான மகத்தான கணினி வளங்களை சமநிலைப்படுத்தும் ஒரு கணக்கீட்டைப் பிரதிபலிக்கிறது, சந்தையின் உயர்ந்த செயல்திறன் மற்றும் அம்சங்களுக்கு, குறிப்பாக விரிவான சூழல் சாளரத்திற்கு செலுத்தத் தயாராக உள்ளது.

செயல்திறன் திறமை மற்றும் தொழில்நுட்ப அடித்தளங்கள்

Gemini 1.5 Pro சாதாரணமாக வரவில்லை; அது ஒரு குறிப்பிடத்தக்க நுழைவைச் செய்தது. அதன் வரையறுக்கப்பட்ட முன்னோட்ட கட்டத்தில் கூட, இந்த மாதிரி தொழில் அளவுகோல்களில் அதன் செயல்திறனுக்காக குறிப்பிடத்தக்க கவனத்தைப் பெற்றது. இது குறிப்பாக LMSys Chatbot Arena leaderboard-இல் முதலிடத்திற்கு உயர்ந்தது, இது குருட்டு பக்கவாட்டு ஒப்பீடுகள் மூலம் கூட்டத்தால் பெறப்பட்ட மனித பின்னூட்டத்தின் அடிப்படையில் LLM-களை வரிசைப்படுத்தும் ஒரு மரியாதைக்குரிய தளமாகும். இது உண்மையான பயனர்களால் உணரப்பட்ட பொதுவான உரையாடல் திறன் மற்றும் பணி நிறைவு ஆகியவற்றில் வலுவான செயல்திறனைக் குறிக்கிறது.

தனிப்பட்ட மதிப்பீடுகளுக்கு அப்பால், Gemini 1.5 Pro சிக்கலான பகுத்தறிவு பணிகளில் விதிவிலக்கான திறனை வெளிப்படுத்தியது. இது AIME 2024 சிக்கல்களில் (மூலப் பொருளில் AIME 2025 என குறிப்பிடப்பட்டுள்ளது, அநேகமாக ஒரு அச்சுப்பிழை) 86.7% என்ற ஈர்க்கக்கூடிய மதிப்பெண்ணைப் பெற்றது, இது U.S. கணித ஒலிம்பியாட்டிற்கான தகுதிச் சுற்றாக செயல்படும் ஒரு சவாலான கணிதப் போட்டியாகும். இந்தத் துறையில் சிறந்து விளங்குவது, எளிய முறை பொருத்தம் அல்லது உரை உருவாக்கத்திற்கு அப்பாற்பட்ட அதிநவீன தர்க்கரீதியான கழித்தல் மற்றும் சிக்கல் தீர்க்கும் திறன்களை சுட்டிக்காட்டுகிறது.

முக்கியமாக, Google இந்த அளவுகோல் சாதனைகள் செலவுகளை செயற்கையாக உயர்த்தும் ‘test-time techniques’-ஐ நாடாமல் அடையப்பட்டன என்பதை எடுத்துக்காட்டுகிறது. Test-time compute என்பது வெளியீட்டு தரத்தை மேம்படுத்துவதற்காக அனுமான கட்டத்தில் (மாதிரி ஒரு பதிலை உருவாக்கும் போது) பயன்படுத்தப்படும் பல்வேறு முறைகளைக் குறிக்கிறது. இந்த நுட்பங்கள் பெரும்பாலும் கணக்கீட்டின் பகுதிகளை பல முறை இயக்குவது, வெவ்வேறு பகுத்தறிவு பாதைகளை ஆராய்வது அல்லது மிகவும் சிக்கலான மாதிரி உத்திகளைப் பயன்படுத்துவது ஆகியவை அடங்கும். மதிப்பெண்களை உயர்த்துவதில் பயனுள்ளதாக இருந்தாலும், அவை தவிர்க்க முடியாமல் கணிசமாக அதிக நேரம் மற்றும் வன்பொருள் வளங்களைக் கோருகின்றன, இதன் மூலம் ஒவ்வொரு கோரிக்கைக்கும் செயல்பாட்டு செலவை (inference cost) அதிகரிக்கின்றன. வலுவான பகுத்தறிவு செயல்திறனை இயல்பாக அடைவதன் மூலம், Gemini 1.5 Pro ஆழமான புரிதல் மற்றும் சிக்கலான சிந்தனை செயல்முறைகள் தேவைப்படும் பணிகளுக்கு மிகவும் பொருளாதார ரீதியாக திறமையான தீர்வை வழங்குகிறது, இது AI-ஐ அளவில் பயன்படுத்தும் வணிகங்களுக்கு ஒரு முக்கிய கருத்தாகும்.

இந்த திறன்களுக்கு அடியில் ஒரு செம்மைப்படுத்தப்பட்ட கட்டமைப்பு உள்ளது. Gemini 1.5 Pro அதன் முன்னோடியான Gemini 1.0 Pro-விலிருந்து (மூல உரையில் Gemini 2.0 Pro என குறிப்பிடப்பட்டுள்ளது) ஒரு பரிணாம வளர்ச்சியைக் குறிக்கிறது, இது Google 2023 இன் பிற்பகுதியில் அறிமுகப்படுத்தியது. பொறியாளர்கள் அடித்தள அடிப்படை மாதிரி மற்றும் முக்கியமான post-training workflow இரண்டையும் மேம்படுத்துவதில் கவனம் செலுத்தியதாகக் கூறப்படுகிறது. Post-training என்பது ஒரு முக்கியமான கட்டமாகும், அங்கு முன் பயிற்சி பெற்ற மாதிரி அறிவுறுத்தல் சரிசெய்தல் மற்றும் மனித பின்னூட்டத்திலிருந்து வலுவூட்டல் கற்றல் (RLHF) போன்ற நுட்பங்களைப் பயன்படுத்தி மேலும் செம்மைப்படுத்தப்படுகிறது. இந்த செயல்முறை மாதிரியின் நடத்தையை விரும்பிய வெளியீடுகளுடன் மிகவும் நெருக்கமாக சீரமைக்கிறது, வழிமுறைகளைப் பின்பற்றும் திறனை மேம்படுத்துகிறது, பாதுகாப்பை மேம்படுத்துகிறது, மேலும் பொதுவாக அதன் பதில்களின் தரம் மற்றும் பயனை உயர்த்துகிறது. மேம்பாடுகள், மூல அறிவு மீட்டெடுப்பை மட்டுமல்ல, மாதிரியின் நடைமுறைப் பயன்பாடு மற்றும் பகுத்தறிவு திறன்களை அதிகரிக்க ஒரு ஒருங்கிணைந்த முயற்சியைக் குறிக்கின்றன. 1.5 Pro மாதிரியின் ஒரு முக்கிய, மூலத்தின் உள்ளடக்கப் பிரிவில் வெளிப்படையாக விவரிக்கப்படவில்லை என்றாலும், அதன் விதிவிலக்காக பெரிய சூழல் சாளரம் - பொதுவாக 1 மில்லியன் டோக்கன்கள், சில முன்னோட்டங்களில் இன்னும் அதிகமாக நீட்டிக்கக்கூடிய திறன்களுடன் - ஒரே நேரத்தில் பரந்த அளவிலான தகவல்களைச் செயலாக்கவும் பகுத்தறியவும் அனுமதிக்கிறது.

AI போட்டியின் தீயை தூண்டுதல்

Gemini 1.5 Pro-வை பரவலாக அணுகக்கூடியதாக மாற்றுவதற்கான Google-இன் முடிவு மறுக்கமுடியாமல் உருவாக்கும் AI-இன் உயர்-பங்கு அரங்கில் ஒரு மூலோபாய நாடகமாகும். இந்தத் துறை தற்போது ஒரு சில முக்கிய வீரர்களால் ஆதிக்கம் செலுத்தப்படுகிறது, ChatGPT-இன் படைப்பாளரான OpenAI, பெரும்பாலும் முன்னணியில் காணப்படுகிறது. போட்டி அம்சங்கள் மற்றும் அளவிடக்கூடிய வரிசைப்படுத்தல் விருப்பங்களுடன் கூடிய சக்திவாய்ந்த, பகுத்தறிவு-கவனம் செலுத்திய மாதிரியை வழங்குவதன் மூலம், Google நிறுவப்பட்ட படிநிலைகளை நேரடியாக சவால் செய்கிறது மற்றும் போட்டியை தீவிரப்படுத்துகிறது.

இந்த நகர்வு போட்டியாளர்கள் மீது, குறிப்பாக OpenAI மீது, தெளிவான அழுத்தத்தை ஏற்படுத்துகிறது. உற்பத்திக்கு தயாரான Gemini 1.5 Pro-வின் கிடைக்கும் தன்மை டெவலப்பர்களுக்கு ஒரு கட்டாய மாற்றீட்டை வழங்குகிறது, இது பயனர்களை திசைதிருப்பவும் சந்தைப் பங்கு இயக்கவியலை பாதிக்கவும் கூடும். இது போட்டியாளர்களை தங்கள் சொந்த வளர்ச்சி சுழற்சிகளை விரைவுபடுத்தவும், தங்கள் விளிம்பைப் பராமரிக்க தங்கள் சலுகைகளைச் செம்மைப்படுத்தவும் கட்டாயப்படுத்துகிறது.

உண்மையில், போட்டி பதில் விரைவாகத் தெரிகிறது. OpenAI-இன் தலைமை நிர்வாக அதிகாரி, Sam Altman, சமீபத்தில் உடனடி எதிர் நகர்வுகளை சமிக்ஞை செய்தார். மூலப் பொருளின்படி, OpenAI வரும் வாரங்களில் இரண்டு புதிய பகுத்தறிவு-கவனம் செலுத்திய மாதிரிகளை வெளியிட திட்டமிட்டுள்ளது: ஒன்று o3 (இது முன்னர் முன்னோட்டமிடப்பட்டது) மற்றும் மற்றொன்று, முன்னர் அறிவிக்கப்படாத மாதிரி o4-mini என அழைக்கப்படுகிறது. ஆரம்பத்தில், o3-ஐ ஒரு தனித்த சலுகையாக வெளியிடும் திட்டம் இருந்திருக்காது, இது Google-இன் Gemini 1.5 Pro வெளியீடு போன்ற சந்தை நகர்வுகளுக்கு பதிலளிக்கும் வகையில் ஒரு சாத்தியமான மூலோபாய சரிசெய்தலைக் குறிக்கிறது.

மேலும் முன்னோக்கிப் பார்க்கும்போது, OpenAI அதன் அடுத்த தலைமுறை முதன்மை மாதிரியான GPT-5-இன் வருகைக்குத் தயாராகி வருகிறது. இந்த வரவிருக்கும் AI அமைப்பு ஒரு குறிப்பிடத்தக்க பாய்ச்சலாக இருக்கும் என்று எதிர்பார்க்கப்படுகிறது, இது பகுத்தறிவு-உகந்ததாக்கப்பட்ட o3 மாதிரியின் திறன்களை (மூலத்தின்படி) மற்ற மேம்பட்ட அம்சங்களின் தொகுப்புடன் ஒருங்கிணைக்கும் என்று கூறப்படுகிறது. OpenAI, GPT-5 அதன் மிகவும் பிரபலமான ChatGPT சேவையின் இலவச மற்றும் கட்டண பதிப்புகள் இரண்டிற்கும் சக்தி அளிக்க விரும்புகிறது, இது அதன் தொழில்நுட்பத் தலைமையை மீண்டும் உறுதிப்படுத்த வடிவமைக்கப்பட்ட ஒரு பெரிய மேம்படுத்தல் சுழற்சியைக் குறிக்கிறது. இந்த முன்னும் பின்னுமான அதிகரிப்பு - Google ஒரு மேம்பட்ட மாதிரியை வெளியிடுகிறது, OpenAI அதன் சொந்த புதிய வெளியீடுகளுடன் எதிர்கொள்கிறது - தற்போதைய AI நிலப்பரப்பின் மாறும் மற்றும் கடுமையாகப் போட்டியிடும் தன்மையை எடுத்துக்காட்டுகிறது. ஒவ்வொரு பெரிய வெளியீடும் திறனின் எல்லைகளைத் தள்ளுகிறது மற்றும் போட்டியாளர்களை பதிலளிக்க கட்டாயப்படுத்துகிறது, இறுதியில் முழுத் துறையிலும் புதுமையின் வேகத்தை துரிதப்படுத்துகிறது.

சுற்றுச்சூழல் அமைப்பிற்கான தாக்கங்கள்: டெவலப்பர்கள் மற்றும் வணிகங்கள் கவனிக்கவும்

Gemini 1.5 Pro போன்ற ஒரு மாதிரியின் பரந்த கிடைக்கும் தன்மை AI டெவலப்பர்களின் உடனடி வட்டத்திற்கு அப்பால் குறிப்பிடத்தக்க தாக்கங்களைக் கொண்டுள்ளது. வணிகங்களுக்கு, இது அவர்களின் தயாரிப்புகள், சேவைகள் மற்றும் உள் செயல்பாடுகளில் அதிநவீன AI பகுத்தறிவை ஒருங்கிணைப்பதற்கான புதிய சாத்தியங்களைத் திறக்கிறது.

டெவலப்பர்கள் முதன்மை பயனாளிகளில் அடங்குவர். அவர்கள் இப்போது முன்னர் மிகவும் சிக்கலானதாகக் கருதப்பட்ட அல்லது தடைசெய்யும் வகையில் பெரிய அளவிலான சூழல் தேவைப்படும் பணிகளைக் கையாளக்கூடிய உற்பத்தி-தரக் கருவிக்கான அணுகலைக் கொண்டுள்ளனர். சாத்தியமான பயன்பாடுகள் பின்வருமாறு:

மேம்பட்ட ஆவண பகுப்பாய்வு: மிக நீண்ட ஆவணங்கள், ஆராய்ச்சிக் கட்டுரைகள் அல்லது சட்ட ஒப்பந்தங்களிலிருந்து சுருக்கம், வினவல் மற்றும் நுண்ணறிவுகளைப் பிரித்தெடுத்தல், பெரிய சூழல் சாளரத்தைப் பயன்படுத்துதல்.
சிக்கலான குறியீடு உருவாக்கம் மற்றும் பிழைத்திருத்தம்: டெவலப்பர்களுக்கு எழுதுதல், மறுசீரமைத்தல் மற்றும் பிழைகளைக் கண்டறிவதில் உதவ பெரிய குறியீடு தளங்களைப் புரிந்துகொள்வது.
அதிநவீன சாட்போட்கள் மற்றும் மெய்நிகர் உதவியாளர்கள்: நீண்ட உரையாடல்களைப் பராமரிக்கவும் பல-படி பகுத்தறிவைச் செய்யவும் கூடிய அதிக சூழல்-விழிப்புணர்வு மற்றும் திறன் கொண்ட உரையாடல் முகவர்களை உருவாக்குதல்.
தரவு விளக்கம் மற்றும் போக்கு பகுப்பாய்வு: வடிவங்களைக் கண்டறிய, அறிக்கைகளை உருவாக்க மற்றும் முடிவெடுப்பதை ஆதரிக்க இயற்கை மொழி அல்லது குறியீட்டில் விவரிக்கப்பட்ட பெரிய தரவுத்தொகுப்புகளை பகுப்பாய்வு செய்தல்.
படைப்பாற்றல் உள்ளடக்க உருவாக்கம்: நீண்ட வடிவ எழுத்து, ஸ்கிரிப்ட் உருவாக்கம் அல்லது சிக்கலான கதை மேம்பாட்டிற்கு உதவுதல், அங்கு நீட்டிக்கப்பட்ட உரை முழுவதும் ஒத்திசைவைப் பேணுவது முக்கியம்.

இருப்பினும், இந்த அணுகல் டெவலப்பர்களுக்கு மூலோபாய தேர்வுகளையும் அளிக்கிறது. அவர்கள் இப்போது Gemini 1.5 Pro-வின் திறன்கள் மற்றும் விலையை OpenAI (GPT-4 Turbo, மற்றும் வரவிருக்கும் மாதிரிகள் போன்றவை), Anthropic (Claude 3 குடும்பம்), Cohere, Mistral AI மற்றும் பல்வேறு திறந்த மூல மாற்றுகளின் சலுகைகளுக்கு எதிராக எடைபோட வேண்டும். இந்த முடிவைப் பாதிக்கும் காரணிகள் குறிப்பிட்ட பணிகள் மற்றும் அளவுகோல் மதிப்பெண்களில் மூல செயல்திறன் மட்டுமல்லாமல், ஒருங்கிணைப்பின் எளிமை, API நம்பகத்தன்மை, தாமதம், குறிப்பிட்ட அம்சத் தொகுப்புகள் (சூழல் சாளர அளவு போன்றவை), தரவு தனியுரிமைக் கொள்கைகள் மற்றும் முக்கியமாக, செலவுக் கட்டமைப்பு ஆகியவையும் அடங்கும். Google அறிமுகப்படுத்திய விலை மாதிரி, அதன் நிலையான மற்றும் நீண்ட-சூழல் ப்ராம்ப்ட்களுக்கு இடையிலான வேறுபாட்டுடன், செயல்பாட்டுச் செலவுகளைத் துல்லியமாக முன்னறிவிக்க எதிர்பார்க்கப்படும் பயன்பாட்டு முறைகள் குறித்து கவனமாகக் கருத்தில் கொள்ள வேண்டும்.

வணிகங்களுக்கு, தாக்கங்கள் மூலோபாயமானவை. Gemini 1.5 Pro போன்ற சக்திவாய்ந்த பகுத்தறிவு மாதிரிகளுக்கான அணுகல் குறிப்பிடத்தக்க போட்டி நன்மைகளைத் திறக்க முடியும். நிறுவனங்கள் மிகவும் சிக்கலான பணிப்பாய்வுகளை தானியக்கமாக்கலாம், சிறந்த AI தொடர்புகள் மூலம் வாடிக்கையாளர் சேவையை மேம்படுத்தலாம், AI-இன் பகுப்பாய்வு சக்தியைப் பயன்படுத்தி ஆராய்ச்சி மற்றும் மேம்பாட்டை விரைவுபடுத்தலாம், மேலும் மேம்பட்ட AI திறன்களின் அடிப்படையில் முற்றிலும் புதிய தயாரிப்பு வகைகளை உருவாக்கலாம். இருப்பினும், இந்த தொழில்நுட்பங்களை ஏற்றுக்கொள்வதற்கு திறமை, உள்கட்டமைப்பு (அல்லது கிளவுட் சேவைகள்) மற்றும் நெறிமுறைக் கருத்தாய்வுகள் மற்றும் தரவு நிர்வாகம் பற்றிய கவனமான திட்டமிடல் ஆகியவற்றில் முதலீடு தேவைப்படுகிறது. அடித்தள மாதிரியின் தேர்வு ஒரு நிறுவனத்தின் ஒட்டுமொத்த AI மூலோபாயத்தின் ஒரு முக்கிய பகுதியாகிறது, இது மேம்பாட்டு செலவுகள் முதல் அவர்களின் AI-இயங்கும் சலுகைகளின் தனித்துவமான திறன்கள் வரை அனைத்தையும் பாதிக்கிறது.

அளவுகோல்களுக்கு அப்பால்: உறுதியான மதிப்பைத் தேடுதல்

LMSys Arena மற்றும் AIME போன்ற அளவுகோல் மதிப்பெண்கள் ஒரு மாதிரியின் திறனுக்கான மதிப்புமிக்க குறிகாட்டிகளை வழங்கினாலும், அவற்றின் நிஜ-உலக முக்கியத்துவம் இந்த திறன்கள் எவ்வளவு திறம்பட உறுதியான மதிப்பாக மொழிபெயர்க்கப்படுகின்றன என்பதில் உள்ளது. Gemini 1.5 Pro-வின் பகுத்தறிவு மீதான முக்கியத்துவம் மற்றும் நீண்ட சூழல்களைக் கையாளும் அதன் திறன் ஆகியவை இந்த விஷயத்தில் குறிப்பாக குறிப்பிடத்தக்கவை.

பகுத்தறிவு என்பது நுண்ணறிவின் அடித்தளமாகும், இது மாதிரியை வெறுமனே தகவல்களை மீட்டெடுப்பது அல்லது வடிவங்களைப் பின்பற்றுவதைத் தாண்டிச் செல்ல உதவுகிறது. இது AI-ஐ அனுமதிக்கிறது:

சிக்கலான வழிமுறைகளைப் புரிந்துகொள்வது: பல-படி கட்டளைகளைப் பின்பற்றுதல் மற்றும் பயனர் கோரிக்கைகளில் உள்ள நுணுக்கங்களைப் புரிந்துகொள்வது.
தர்க்கரீதியான கழித்தல் செய்தல்: வழங்கப்பட்ட தகவலின் அடிப்படையில் முடிவுகளை எடுப்பது, முரண்பாடுகளைக் கண்டறிவது மற்றும் படி-படி சிந்தனை தேவைப்படும் சிக்கல்களைத் தீர்ப்பது.
காரணம் மற்றும் விளைவைப் பகுப்பாய்வு செய்தல்: தரவு அல்லது கதைகளுக்குள் உள்ள உறவுகளைப் புரிந்துகொள்வது.
எதிர்நடப்பு சிந்தனையில் ஈடுபடுதல்: உள்ளீட்டு நிலைமைகளில் ஏற்படும் மாற்றங்களின் அடிப்படையில் ‘என்ன நடந்திருக்கும்’ காட்சிகளை ஆராய்வது.

நீண்ட சூழல் சாளரம் இந்த பகுத்தறிவு திறனை ஆழமாக நிறைவு செய்கிறது. ஒரு ப்ராம்ப்டில் பரந்த அளவிலான தகவல்களை (முழு புத்தகங்கள் அல்லது குறியீடு களஞ்சியங்களுக்கு சமமானதாக இருக்கலாம்) செயலாக்குவதன் மூலம், Gemini 1.5 Pro ஒத்திசைவைப் பராமரிக்கலாம், சார்புகளைக் கண்காணிக்கலாம் மற்றும் விரிவான உள்ளீடுகள் முழுவதும் தகவல்களைத் தொகுக்கலாம். நீண்ட சட்டக் கண்டுபிடிப்பு ஆவணங்களை பகுப்பாய்வு செய்வது, ஒரு திரைக்கதையின் முழு கதை வளைவைப் புரிந்துகொள்வது அல்லது சூழல் பல கோப்புகளில் பரவியிருக்கும் சிக்கலான மென்பொருள் அமைப்புகளை பிழைத்திருத்தம் செய்வது போன்ற பணிகளுக்கு இது முக்கியமானது.

இந்த கலவையானது உயர்-மதிப்பு, அறிவு-தீவிர பணிகளுக்குப் பொருத்தமானது என்பதைக் குறிக்கிறது, அங்கு ஆழமான சூழலைப் புரிந்துகொள்வதும் தர்க்கரீதியான படிகளைப் பயன்படுத்துவதும் மிக முக்கியம். மதிப்பு முன்மொழிவு என்பது உரையை உருவாக்குவது மட்டுமல்ல; இது சிக்கலான அறிவுசார் சவால்களைச் சமாளிக்கும் திறன் கொண்ட ஒரு அறிவாற்றல் கூட்டாளரை வழங்குவதாகும். வணிகங்களுக்கு, இது வேகமான R&D சுழற்சிகள், மாறுபட்ட தரவு உள்ளீடுகளின் அடிப்படையில் மிகவும் துல்லியமான நிதி முன்கணிப்பு அல்லது நீண்ட தொடர்புகளில் வெளிப்படுத்தப்பட்ட ஒரு மாணவரின் புரிதலுக்கு ஏற்றவாறு மிகவும் தனிப்பயனாக்கப்பட்ட கல்வி கருவிகள் என்று பொருள்படும். Google விலையுயர்ந்த test-time compute இல்லாமல் வலுவான செயல்திறனைக் கோருகிறது என்ற உண்மை இந்த மதிப்பு முன்மொழிவை மேலும் மேம்படுத்துகிறது, இது அதிநவீன பகுத்தறிவு முன்னர் சாத்தியமானதை விட மிகவும் நிர்வகிக்கக்கூடிய செயல்பாட்டு செலவில் அடையப்படலாம் என்று பரிந்துரைக்கிறது.

AI முன்னேற்றத்தின் விரிவடையும் கதை

Google-இன் Gemini 1.5 Pro-வின் பொது முன்னோட்டம் செயற்கை நுண்ணறிவு வளர்ச்சியின் தொடர்ச்சியான கதையில் மற்றொரு அத்தியாயமாகும். இது தொழில்நுட்பத்தின் முதிர்ச்சியைக் குறிக்கிறது, சக்திவாய்ந்த பகுத்தறிவு திறன்களை ஆராய்ச்சி ஆய்வகத்திலிருந்து உருவாக்குபவர்கள் மற்றும் வணிகங்களின் கைகளுக்கு நகர்த்துகிறது. இது தூண்டும் போட்டி பதில்கள் துறையின் சுறுசுறுப்பை அடிக்கோடிட்டுக் காட்டுகின்றன, புதுமையின் வேகம் விரைவில் குறைய வாய்ப்பில்லை என்பதை உறுதி செய்கிறது.

முன்னோக்கிச் செல்லும் பாதை Gemini 1.5 Pro மற்றும் அதன் வாரிசுகளின் தொடர்ச்சியான செம்மைப்படுத்தல், சந்தை பின்னூட்டம் மற்றும் போட்டி அழுத்தங்களின் அடிப்படையில் விலை மாதிரிகளில் சாத்தியமான சரிசெய்தல் மற்றும் Google-இன் பரந்த தயாரிப்புகள் மற்றும் கிளவுட் சேவைகளின் சுற்றுச்சூழல் அமைப்பில் ஆழமான ஒருங்கிணைப்பு ஆகியவற்றை உள்ளடக்கியதாக இருக்கும். டெவலப்பர்கள் மாதிரியின் வரம்புகளைத் தொடர்ந்து ஆராய்வார்கள், புதுமையான பயன்பாடுகளைக் கண்டுபிடிப்பார்கள் மற்றும் AI என்ன சாதிக்க முடியும் என்பதன் எல்லைகளைத் தள்ளுவார்கள்.

கவனம் பெருகிய முறையில் தூய திறன் ஆர்ப்பாட்டங்களிலிருந்து நடைமுறை வரிசைப்படுத்தல், செயல்திறன் மற்றும் இந்த சக்திவாய்ந்த கருவிகளின் பொறுப்பான பயன்பாடு ஆகியவற்றிற்கு மாறும். Gemini 1.5 Pro போன்ற மாதிரிகள் நமது டிஜிட்டல் உள்கட்டமைப்பு மற்றும் அன்றாட வாழ்வில் ஆழமாகப் பதிக்கப்படுவதால், செலவு-செயல்திறன், நம்பகத்தன்மை, பாதுகாப்பு மற்றும் நெறிமுறை சீரமைப்பு போன்ற சிக்கல்கள் மையமாக இருக்கும். இந்த வெளியீடு ஒரு இறுதிப் புள்ளி அல்ல, மாறாக பெருகிய முறையில் புத்திசாலித்தனமான மற்றும் ஒருங்கிணைந்த AI அமைப்புகளை நோக்கிய ஒரு பாதையில் ஒரு குறிப்பிடத்தக்க மைல்கல் ஆகும், இது தொழில்களை மறுவடிவமைக்கிறது மற்றும் கணக்கீடு பற்றிய நமது புரிதலை சவால் செய்கிறது. போட்டி அடுத்த திருப்புமுனை எப்போதும் மூலையில் உள்ளது என்பதை உறுதி செய்கிறது.

புதுப்பிக்கப்பட்டது ௨௦௨௫-௦௪-௦௫

# Google # Gemini # AIGC