OpenAI'யின் இரண்டாவது முகவர்
மூன்று வாரங்களுக்கு முன்பு, OpenAI தனது இரண்டாவது முகவரான டீப் ரிசர்ச்சை அறிமுகப்படுத்தியது. இந்த முகவர் பல வலைத்தளங்களைத் தேடவும், 5-30 நிமிடங்களில் விரிவான ஆன்லைன் ஆராய்ச்சியை முடிக்கவும், தகவல்களைத் தொகுக்கவும், மேற்கோள்களுடன் விரிவான அறிக்கைகளை வழங்கவும் முடியும்.
இந்த கட்டுரை Sequoia Capital உடனான Isa Fulford மற்றும் Josh Tobin ஆகியோரின் நேர்காணலைத் தொகுத்து ஒழுங்கமைக்கிறது, இவர்கள் OpenAI’யின் டீப் ரிசர்ச்சின் தலைவர்கள். டீப் ரிசர்ச்சின் பின்னணியில் உள்ள தொழில்நுட்ப விவரங்கள் மற்றும் தயாரிப்பு சிந்தனை, அவர்கள் தற்போது கவனித்து வரும் பயன்பாட்டு நிகழ்வுகள் ஆகியவற்றை இரண்டு உறுப்பினர்களும் விரிவாகப் பகிர்ந்து கொள்கிறார்கள்.
டீப் ரிசர்ச், மாதிரியின் நீண்ட-கால பணிகளைக் கையாளும் திறனைப் பற்றிய OpenAI’யின் உள் ஆய்வில் இருந்து உருவானது. குழுவின் நீண்டகால இலக்கு பயனர்களுக்கு எதிர்காலத்தில் இறுதி முகவரை வழங்குவதாகும்: வலைத் தேடல், கணினி பயன்பாடு அல்லது முகவர் செய்ய விரும்பும் வேறு எந்த பணிகளுக்கும் ஒரு இயற்கையான ஆல் இன் ஒன் தீர்வு.
டீப் ரிசர்ச் தயாரிப்பு மட்டத்திலும் குறிப்பாக உகந்ததாக்கப்பட்டுள்ளது. உதாரணமாக, எங்கள் டீப்சீக் பகுப்பாய்வில் குறிப்பிடப்பட்டுள்ளபடி, டீப் ரிசர்ச் தெளிவான மேற்கோள்கள் மற்றும் சிந்தனைச் சங்கிலி (CoT) மூலம் பயனர் நம்பிக்கையை மேம்படுத்துகிறது. பணியைப் பற்றிய நிலையான புரிதலை உறுதிப்படுத்த குழு ஒரு தெளிவுபடுத்தும் ஓட்டத்தையும் வடிவமைத்துள்ளது. டீப் ரிசர்ச் தகவல் மீட்டெடுப்பு மற்றும் அமைப்பில் AI தேடல் மற்றும் ChatGPT ஐ விட சிறந்தது. இருப்பினும், இந்த கட்டத்தில், டீப் ரிசர்ச் இருக்கும் தகவல்களிலிருந்து புதிய நுண்ணறிவுகளைப் பிரித்தெடுப்பதில் அவ்வளவு பயனுள்ளதாக இல்லை, இன்னும் புதிய அறிவியல் கண்டுபிடிப்புகளைச் செய்ய முடியாது.
முக்கிய குறிப்புகள்:
- OpenAI தனது இரண்டாவது முகவரான டீப் ரிசர்ச்சை அறிமுகப்படுத்தியுள்ளது, இது முழுமையான ஆன்லைன் விசாரணைகளை மேற்கொள்ளும் திறன் கொண்டது.
- முகமைத்துவ திறன்கள் மாதிரியின் இறுதி முதல் இறுதி பயிற்சியிலிருந்து உருவாகின்றன.
- டீப் ரிசர்ச் தகவல் தொகுப்பு மற்றும் தெளிவற்ற உண்மைகளைக் கண்டறிவதில் சிறந்து விளங்குகிறது.
- பயன்பாட்டு நிகழ்வுகள் தொழில்முறை வேலை, தனிப்பட்ட வாழ்க்கை, நிரலாக்கம் மற்றும் கல்வி ஆகியவற்றை உள்ளடக்கியது.
- 2025 ஆம் ஆண்டில் முகவர்களுக்கான குறிப்பிடத்தக்க முன்னேற்றங்களை குழு எதிர்பார்க்கிறது.
முகமைத்துவ திறன்கள் மாதிரியின் இறுதி முதல் இறுதி மாதிரி பயிற்சியிலிருந்து உருவாகின்றன
டீப் ரிசர்ச் என்பது பல ஆன்லைன் வலைத்தளங்களைத் தேடவும், விரிவான அறிக்கைகளை உருவாக்கவும், மனிதர்களுக்கு பல மணிநேரம் எடுக்கும் பல பணிகளை முடிக்கவும் திறன் கொண்ட ஒரு முகவர். ChatGPT க்குள் செயல்படுவதால், இது சுமார் 5-30 நிமிடங்களில் கேள்விகளுக்கு பதிலளிக்கிறது, ஆழமான ஆராய்ச்சியை செயல்படுத்துகிறது மற்றும் நிலையான ChatGPT ஐ விட விரிவான மற்றும் குறிப்பிட்ட பதில்களை வழங்குகிறது. OpenAI முன்பு ஆபரேட்டரை அறிமுகப்படுத்தியது, டீப் ரிசர்ச் அதன் இரண்டாவது முகவர், மேலும் பல வரவுள்ளன.
தோற்றம்
சுமார் ஒரு வருடத்திற்கு முன்பு, OpenAI உள்நாட்டில் ஒரு பகுத்தறிவு முன்னுதாரணத்தை பின்பற்றத் தொடங்கியது, பதிலளிப்பதற்கு முன் சிந்திக்க மாதிரிகளுக்கு பயிற்சி அளிப்பதை நோக்கமாகக் கொண்டது. இந்த அணுகுமுறை மிகவும் வெற்றிகரமாக நிரூபிக்கப்பட்டது.
ஆரம்பத்தில், OpenAI கணிதம் மற்றும் அறிவியலில் கவனம் செலுத்தியது. இருப்பினும், இந்த புதிய பகுத்தறிவு மாதிரி கட்டமைப்பு, முகவர் திறன்களை உள்ளடக்கிய நீண்ட கால பணிகளைக் கையாளும் திறனையும் திறந்தது என்பதை அவர்கள் கண்டுபிடித்தனர்.
அதே நேரத்தில், OpenAI பல பணிகளுக்கு விரிவான ஆன்லைன் ஆராய்ச்சி அல்லது வெளிப்புற சூழல், வலுவான பகுத்தறிவு திறன்கள், தகவல் ஆதாரங்களை அறிதல் மற்றும் ஒரு அளவு படைப்பாற்றல் தேவை என்பதை அங்கீகரித்தது. இறுதியில், OpenAI இந்த பணிகளைக் கையாளும் திறன் கொண்ட மாதிரி பயிற்சி முறைகளை உருவாக்கியது. உலாவல் பணிகளைச் செய்ய மாதிரிகளுக்கு பயிற்சி அளிக்க அவர்கள் முடிவு செய்தனர், பகுத்தறிவு மாதிரிகளுக்கு பயிற்சி அளிப்பதற்கு அதே முறைகளைப் பயன்படுத்தி, ஆனால் அதிக யதார்த்தமான பணிகளுக்குப் பயன்படுத்தப்பட்டது.
டீப் ரிசர்ச் திட்டம் Isa Fulford மற்றும் Yash Patil ஆகியோரின் அசல் டெமோவுடன் தொடங்கியது. Josh Tobin ஒரு ஸ்டார்ட்அப்பில் பணிபுரிந்த பிறகு சுமார் ஆறு மாதங்களுக்கு முன்பு OpenAI இல் மீண்டும் சேர்ந்தார், அடித்தளப் பணியில் ஆழ்ந்த ஆர்வம் காட்டினார், மேலும் டீப் ரிசர்ச் திட்டத்தில் சேர்ந்தார்.
முக்கிய நபர்கள்:
- Isa Fulford: OpenAI’யின் பயிற்சிக்குப் பிந்தைய குழுவில் AI ஆராய்ச்சியாளர், ChatGPT Retrieval Plugin-க்கு முக்கிய பங்களிப்பாளர்.
- Yash Patil: OpenAI’யின் பயிற்சிக்குப் பிந்தைய குழுவில் உள்ள முக்கிய மாதிரி குழுவின் உறுப்பினர், ஸ்டான்போர்டில் இருந்து வெளியேறியவர்.
- Josh Tobin: முன்பு OpenAI இல் ஆராய்ச்சி விஞ்ஞானியாக இருந்தார், பின்னர் Gantry (பகுப்பாய்வு, எச்சரிக்கைகள் மற்றும் மனித கருத்துக்கள் மூலம் ML ஐ மேம்படுத்துவதற்கான ஒரு தயாரிப்பு) நிறுவினார். அவர் OpenAI இல் மீண்டும் சேர்ந்தார் மற்றும் தற்போது முகவர்கள் தயாரிப்பு ஆராய்ச்சி குழுவை வழிநடத்துகிறார்.
தெளிவுபடுத்தும் ஓட்டம்
டீப் ரிசர்ச் ஒரு தனித்துவமான வடிவமைப்பைக் கொண்டுள்ளது: தெளிவுபடுத்தும் ஓட்டம். ஆராய்ச்சியைத் தொடங்குவதற்கு முன், டீப் ரிசர்ச் மாதிரி பயனரிடம் கேள்விகளைக் கேட்கிறது. பொதுவாக, ChatGPT ஒரு பதிலின் முடிவில் மட்டுமே பின்தொடர்தல் கேள்விகளைக் கேட்கிறது அல்லது பதில் திருப்திகரமாக இருக்கிறதா என்று விசாரிக்கிறது, டீப் ரிசர்ச் போலல்லாமல், இது இந்த நடத்தையில் முன்னதாகவே ஈடுபடுகிறது.
இது குழுவின் வேண்டுமென்றே வடிவமைக்கப்பட்ட தேர்வு. பயனர்களின் அறிவுறுத்தல்கள் மிகவும் தெளிவாகவும் விரிவாகவும் இருக்கும்போது மட்டுமே டீப் ரிசர்ச் மாதிரியிலிருந்து சிறந்த பதில்களைப் பெறுகிறார்கள். இருப்பினும், பயனர்கள் பெரும்பாலும் தங்கள் ஆரம்ப அறிவுறுத்தலில் அனைத்து தகவல்களையும் வழங்குவதில்லை. எனவே, 5 அல்லது 30 நிமிடங்கள் காத்திருந்த பிறகு, பயனர்கள் போதுமான விரிவான மற்றும் திருப்திகரமான பதிலைப் பெறுவதை OpenAI உறுதிப்படுத்த விரும்பியது. மாதிரிக்கு தேவையான அனைத்து விவரங்களையும் பயனர்கள் வழங்குவதை உறுதி செய்வதற்காக இந்த கூடுதல் படி சேர்க்கப்பட்டது.
X இல் உள்ள பல பயனர்கள் தங்கள் அறிவுறுத்தல்களைச் செம்மைப்படுத்த முதலில் o1 அல்லது o1 Pro உடன் தொடர்புகொள்வதைக் குறிப்பிட்டுள்ளனர். திருப்தி அடைந்தவுடன், அவர்கள் அறிவுறுத்தலை டீப் ரிசர்ச்சிற்கு அனுப்புகிறார்கள்.
முகவர்களின் இறுதி வடிவம்
கடந்த சில மாதங்களில், OpenAI டீப் ரிசர்ச்சின் மூன்று வெவ்வேறு பதிப்புகளை அறிமுகப்படுத்தியுள்ளது, அவை அனைத்தும் டீப் ரிசர்ச் என்று பெயரிடப்பட்டுள்ளன. Josh Tobin ஒவ்வொரு தயாரிப்புக்கும் அதன் பலம் மற்றும் பலவீனங்கள் இருந்தாலும், அவற்றுக்கிடையேயான தர வேறுபாடுகள் தெளிவாகத் தெரிகிறது என்று நம்புகிறார். இறுதியில், இது மாதிரிகள் எவ்வாறு கட்டமைக்கப்படுகின்றன, தரவுத்தொகுப்புகளை உருவாக்குவதில் முதலீடு செய்யப்பட்ட முயற்சி மற்றும் O-தொடர் மாதிரிகளை இயந்திரமாகப் பயன்படுத்துதல் ஆகியவற்றின் காரணமாகும். இது டீப் ரிசர்ச் மாதிரிகளை உகந்ததாக்க அனுமதிக்கிறது, அதிக புத்திசாலித்தனமான மற்றும் உயர்தர கருவிகளை உருவாக்குகிறது.
தற்போது, டீப் ரிசர்ச், O3 மற்றும் ஆபரேட்டர் ஆகியவை ஒப்பீட்டளவில் சுதந்திரமானவை. இருப்பினும், OpenAI பயனர்கள் இறுதியில் ஒரு வலைத் தேடலைச் செய்யக்கூடிய, கணினிகளைப் பயன்படுத்தக்கூடிய அல்லது விரும்பிய பிற பணிகளை முடிக்கக்கூடிய ஒரு ஒற்றை, இறுதி முகவரைக் கொண்டிருப்பதை நோக்கமாகக் கொண்டுள்ளது, இந்த எல்லா செயல்பாடுகளையும் மிகவும் இயற்கையான வழியில் ஒருங்கிணைக்கிறது.
இறுதி முதல் இறுதி பயிற்சி என்பது மாதிரியின் சக்திக்கு அடிப்படையான காரணம்
டீப் ரிசர்ச்சின் அடிப்படை மாதிரி O3 இன் நன்றாகச் சரிசெய்யப்பட்ட பதிப்பாகும். O3 என்பது OpenAI’யின் மிகவும் மேம்பட்ட பகுத்தறிவு மாதிரி, மேலும் டீப் ரிசர்ச்சின் பகுப்பாய்வு திறன்களில் பெரும்பாலானவை அதிலிருந்து வருகின்றன. OpenAI குறிப்பாக டீப் ரிசர்ச் மாதிரியை சிக்கலான உலாவல் பணிகள் மற்றும் பிற பகுத்தறிவு பணிகளில் பயிற்சி அளித்தது. எனவே, டீப் ரிசர்ச் உலாவல் கருவிகள் மற்றும் பைதான் கருவிகளையும் பயன்படுத்தலாம். இந்த பணிகளில் இறுதி முதல் இறுதி பயிற்சி மூலம், டீப் ரிசர்ச் அவற்றைக் கையாள்வதற்கான உத்திகளைக் கற்றுக்கொண்டது, இறுதியில் மாதிரியை ஆன்லைன் தேடல் பகுப்பாய்வில் சிறந்து விளங்கச் செய்தது.
உள்ளுணர்வாக, ஒரு பயனர் ஒரு கோரிக்கையை வைக்கிறார், மேலும் மாதிரி முதலில் அதைப் பற்றி கவனமாக சிந்திக்கிறது. பின்னர், அது தொடர்புடைய தகவல்களைத் தேடுகிறது, அதை பிரித்தெடுக்கிறது மற்றும் படிக்கிறது. இந்த தகவல் கோரிக்கையுடன் எவ்வாறு தொடர்புடையது என்பதைப் புரிந்துகொண்ட பிறகு, பயனரின் விரும்பிய இறுதி பதிலுக்கு நெருக்கமாகச் செல்ல அடுத்து எதைத் தேடுவது என்பதை மாதிரி தீர்மானிக்கிறது. டீப் ரிசர்ச் இந்த எல்லா தகவல்களையும் ஒரு நேர்த்தியான அறிக்கையில் ஒருங்கிணைக்க முடியும், அசல் ஆதாரங்களை சுட்டிக்காட்டும் மேற்கோள்களுடன்.
டீப் ரிசர்ச்சிற்கு அதன் முகவர் திறன்களை வழங்கும் கண்டுபிடிப்பு OpenAI’யின் மாதிரியின் இறுதி முதல் இறுதி பயிற்சியில் உள்ளது. இதன் பொருள் ஆராய்ச்சி செயல்பாட்டின் போது பல செயல்பாடுகள் முன்கூட்டியே கணிக்க முடியாதவை. ஒரு மொழி மாதிரி, நிரல் அல்லது ஸ்கிரிப்டை எழுதுவதன் மூலம் மாதிரி பயிற்சி மூலம் பெறும் நெகிழ்வுத்தன்மையை அடைவது சாத்தியமில்லை. பயிற்சி மூலம், டீப் ரிசர்ச் மாதிரி நிகழ்நேர வலை தகவலுக்கு எவ்வாறு எதிர்வினையாற்றுவது மற்றும் அது பார்ப்பதன் அடிப்படையில் உத்திகளை உடனடியாக சரிசெய்வது எப்படி என்பதைக் கற்றுக்கொண்டது. எனவே, டீப் ரிசர்ச் மாதிரி உண்மையில் மிகவும் ஆக்கப்பூர்வமான தேடல்களை நடத்துகிறது. அடுத்து எதைத் தேடுவது அல்லது CoT இன் சுருக்கங்களைப் படிப்பதன் மூலம் சில சிக்கல்களை எவ்வாறு தவிர்ப்பது என்பதை தீர்மானிப்பதில் மாதிரி எவ்வளவு புத்திசாலித்தனமானது என்பதை பயனர்கள் பார்க்கலாம்.
டீப் ரிசர்ச் மற்றும் AI தேடலுக்கு இடையிலான வேறுபாடுகள்
John Collison’னின் டீப் ரிசர்ச்சின் திறனில் எவ்வளவு நிகழ்நேர வலை உள்ளடக்க அணுகலில் இருந்து வருகிறது மற்றும் எவ்வளவு CoT இலிருந்து வருகிறது என்ற கேள்விக்கு, இரண்டு OpenAI ஆராய்ச்சியாளர்களும் டீப் ரிசர்ச்சின் சிறந்த திறன் இரண்டும் இணைந்ததன் விளைவு என்று நம்புகிறார்கள்.
மற்ற AI தேடல் தயாரிப்புகள் இறுதி முதல் இறுதி வரை பயிற்சி அளிக்கப்படவில்லை, எனவே அவை டீப் ரிசர்ச் போன்ற தகவல்களுக்கு பதிலளிப்பதில் நெகிழ்வானவை அல்ல, குறிப்பிட்ட சிக்கல்களைத் தீர்ப்பதில் அவை ஆக்கப்பூர்வமானவை அல்ல.
OpenAI இல் சேருவதற்கு முன்பு, Josh Tobin ஒரு ஸ்டார்ட்அப்பில் பணிபுரிந்தார் மற்றும் பெரும்பாலான மக்கள் முகவர்களை உருவாக்குவதை விவரிக்கும் விதத்தில் முகவர்களை உருவாக்க முயன்றார், அடிப்படையில் LLM கள் சில முனைகளில் தலையிடும் ஒரு செயல்பாட்டு வரைபடத்தை உருவாக்கினார். LLM அடுத்து என்ன செய்வது என்பதை தீர்மானிக்க முடியும் என்றாலும், படிகளின் முழு வரிசையின் தர்க்கம் மனிதர்களால் வரையறுக்கப்படுகிறது.
Josh Tobin இது விரைவான முன்மாதிரிக்கான ஒரு சக்திவாய்ந்த முறையாக இருப்பதைக் கண்டறிந்தார், ஆனால் அது விரைவில் உண்மையான உலகில் சிக்கல்களை எதிர்கொண்டது. மாதிரி எதிர்கொள்ளக்கூடிய அனைத்து சூழ்நிலைகளையும் முன்கூட்டியே பார்ப்பது மற்றும் அது எடுக்க விரும்பும் பாதைகளின் வெவ்வேறு கிளைகள் அனைத்தையும் கருத்தில் கொள்வது கடினம். மேலும், இந்த மாதிரிகள் முடிவுகளை எடுப்பதற்கு குறிப்பாக பயிற்சி அளிக்கப்படாததால், அவை பெரும்பாலும் முனைகளில் சிறந்த முடிவெடுப்பவர்கள் அல்ல; அவை முடிவெடுப்பதைப் போன்ற ஒன்றைச் செய்ய பயிற்சி அளிக்கப்படுகின்றன.
இது டீப் ரிசர்ச் மாதிரியின் உண்மையான சக்தி நேரடி இறுதி முதல் இறுதி பயிற்சியிலிருந்து வருகிறது என்பதை மீண்டும் வலியுறுத்துகிறது, பயனர்கள் உண்மையில் தீர்க்க வேண்டிய பணிகளைத் தீர்ப்பதை நோக்கமாகக் கொண்டது. எனவே, ஒரு செயல்பாட்டு வரைபடத்தை அமைக்கவோ அல்லது பின்னணி கட்டமைப்பில் முனை முடிவுகளை எடுக்கவோ தேவையில்லை; எல்லாமே மாதிரியால் இயக்கப்படுகிறது.
மேலும், ஒரு பயனருக்கு மிகவும் குறிப்பிட்ட மற்றும் கணிக்கக்கூடிய பணிப்பாய்வு இருந்தால், Josh Tobin மேலே விவரித்த வழியில் அதைச் செய்வது மதிப்புமிக்கது. ஆனால் மிகவும் நெகிழ்வான செயலாக்கம் தேவைப்பட்டால், டீப் ரிசர்ச் போன்ற ஒரு அணுகுமுறை சிறந்த தேர்வாக இருக்கலாம்.
Josh Tobin சில கண்டிப்பான விதிகள் மாதிரியில் கடினமாக குறியிடப்படக்கூடாது என்று பரிந்துரைக்கிறார். ‘மாதிரி ஒரு குறிப்பிட்ட தரவுத்தளத்தை அணுகக்கூடாது’ போன்ற தேவை இருந்தால், அதை கைமுறையாக எழுதப்பட்ட தர்க்கத்துடன் செயல்படுத்துவது நல்லது. குறியீட்டை எழுதுவதன் மூலம் மாதிரியை விட தாங்கள் புத்திசாலியாக இருக்க முடியும் என்று மக்கள் அடிக்கடி நினைக்கிறார்கள், ஆனால் உண்மையில், புலம் வளர்ச்சியடையும் போது, மாதிரிகள் பொதுவாக மனிதர்களை விட சிறந்த தீர்வுகளைக் கொண்டு வருகின்றன.
இயந்திர கற்றலின் மிக முக்கியமான பாடங்களில் ஒன்று, நீங்கள் பெறும் முடிவுகள் நீங்கள் எதை உகந்ததாக்குகிறீர்கள் என்பதைப் பொறுத்தது. எனவே, பயனர்கள் விரும்பிய முடிவை நேரடியாக உகந்ததாக்குவதற்கு ஒரு அமைப்பை அமைக்க முடிந்தால், அது முழு பணிக்கும் பொருந்தாத மாதிரிகளை ஒன்றாக இணைக்க முயற்சிப்பதை விட மிகவும் சிறப்பாக இருக்கும். எனவே, ஒட்டுமொத்த மாதிரி அடிப்படையில் RL ட்யூனிங் மிகவும் சக்திவாய்ந்த முகவர்களை உருவாக்குவதில் ஒரு முக்கிய பகுதியாக மாறக்கூடும்.
உயர்தர தரவு என்பது மாதிரி வெற்றிக்கான முக்கிய காரணிகளில் ஒன்றாகும்
டீப் ரிசர்ச் மாதிரியின் வெற்றிக்கான முக்கிய காரணிகளில் ஒன்று உயர்தர தரவுத்தொகுப்பைக் கொண்டிருப்பது. மாதிரியில் உள்ளிடப்பட்ட தரவின் தரம் மாதிரியின் தரத்தை தீர்மானிக்கும் முக்கிய காரணியாக இருக்கலாம். டீப் ரிசர்ச் திட்டத்தில், Edward Sun அனைத்து தரவுத்தொகுப்புகளையும் மேம்படுத்துகிறார்.
டீப் ரிசர்ச்சின் நன்மைகள்
டீப் ரிசர்ச்சின் பலம், பயனர்கள் தங்கள் தேவைகளைப் பற்றிய விரிவான விளக்கத்தைக் கொண்டிருக்கும்போது சிறந்த பதில்களை வழங்கும் திறனில் உள்ளது. இருப்பினும், பயனரின் கேள்வி தெளிவற்றதாக இருந்தாலும், டீப் ரிசர்ச் விரும்பிய தகவலை தெளிவுபடுத்த முடியும். பயனர்கள் ஒரு குறிப்பிட்ட தகவலைத் தேடும்போது இது மிகவும் சக்தி வாய்ந்தது.
டீப் ரிசர்ச் ஒரு மூலத்தைப் பற்றிய அனைத்து தகவல்களையும் பரவலாக சேகரிக்கும் திறன் கொண்டது மட்டுமல்லாமல், மிகவும் தெளிவற்ற உண்மைகளைக் கண்டறிவதிலும் சிறந்து விளங்குகிறது, அதாவது பாரம்பரிய தேடலில் முதல் சில பக்கங்களில் தோன்றாத நீண்ட வால் உள்ளடக்கம், தெளிவற்ற தொலைக்காட்சி நிகழ்ச்சியின் ஒரு குறிப்பிட்ட அத்தியாயத்தின் விவரங்கள் போன்றவை. ஒரு ஆஸ்திரிய ஜெனரலைப் பற்றிய ஒரு கேள்வியில், ChatGPT ஒருமுறை தவறான பதிலைக் கொடுத்தது, அதே நேரத்தில் டீப் ரிசர்ச் சரியான பதிலைக் கண்டுபிடித்தது.
டீப் ரிசர்ச் தகவல்களைத் தொகுப்பதில் மிகவும் சிறந்தது, குறிப்பாக குறிப்பிட்ட, கண்டுபிடிக்க கடினமான தகவலைக் கண்டுபிடிப்பதில். இருப்பினும், டீப் ரிசர்ச் இருக்கும் தகவல்களிலிருந்து புதிய நுண்ணறிவுகளைப் பிரித்தெடுப்பதில் அவ்வளவு பயனுள்ளதாக இல்லை, இன்னும் புதிய அறிவியல் கண்டுபிடிப்புகளைச் செய்ய முடியாது.
டீப் ரிசர்ச்சின் பயன்பாட்டு நிகழ்வுகள்
இலக்கு பயனர்கள்
டீப் ரிசர்ச் தங்கள் அன்றாட வேலை அல்லது வாழ்க்கையில் அறிவுசார் பணியில் ஈடுபட்டுள்ள எவருக்கும் வடிவமைக்கப்பட்டுள்ளது, குறிப்பாக அதிக அளவு தகவல்களை சேகரிக்க, தரவை பகுப்பாய்வு செய்ய மற்றும் முடிவுகளை எடுக்க வேண்டியவர்களுக்கு. சந்தைகள், நிறுவனங்கள் மற்றும் ரியல் எஸ்டேட் போன்ற பகுதிகளில் உள்ள சூழ்நிலையைப் புரிந்துகொள்ள, ஆராய்ச்சி போன்ற தங்கள் வேலைக்கு டீப் ரிசர்ச்சை பல பயனர்கள் பயன்படுத்துகின்றனர்.
பயன்பாட்டு நிகழ்வுகள்
OpenAI டீப் ரிசர்ச் வணிக மற்றும் தனிப்பட்ட வாழ்க்கை சூழ்நிலைகள் இரண்டிற்கும் சேவை செய்ய முடியும் என்று நம்புகிறது, ஏனெனில் இது உண்மையில் வேலை மற்றும் தனிப்பட்ட வாழ்க்கை இரண்டிற்கும் பொருந்தக்கூடிய ஒரு பல்துறை திறன். டீப் ரிசர்ச்சின் ஈர்ப்பு நிறைய நேரத்தை மிச்சப்படுத்தும் திறனில் உள்ளது. பல மணிநேரம் அல்லது நாட்கள் கூட எடுத்திருக்கக்கூடிய சில பணிகள் இப்போது டீப் ரிசர்ச் மூலம் 90% பதிலளிக்கப்படலாம். வணிக சூழ்நிலைகளில் இதே போன்ற பணிகள் இருக்கும் என்று OpenAI நம்புகிறது, ஆனால் டீப் ரிசர்ச் மக்களின் தனிப்பட்ட வாழ்க்கையின் ஒரு பகுதியாக மாறும்.
டீப் ரிசர்ச் பணியாளர்களை மாற்றுவது பற்றியது அல்ல. அறிவுசார் பணிகளுக்கு, குறிப்பாக தகவல்களைக் கண்டுபிடித்து முடிவுகளை எடுக்க நிறைய நேரம் தேவைப்படும் பணிகளுக்கு, டீப் ரிசர்ச் மக்களுக்கு சூப்பர் பவர்களை வழங்கும், 4 அல்லது 8 மணிநேரம் எடுத்திருக்கக்கூடிய பணிகளை 5 நிமிடங்களில் முடிக்க உதவும், பயனர்கள் மேலும் சாதிக்க அனுமதிக்கிறது.
மருத்துவம், முதலீடு மற்றும் பிற தொழில்முறை வேலை சூழ்நிலைகள்; ஷாப்பிங், பயணம் மற்றும் பிற குடும்ப சூழ்நிலைகள்; நிரலாக்கம் மற்றும் தனிப்பயனாக்கப்பட்ட கல்வி உள்ளிட்ட பயன்பாட்டு நிகழ்வுகளை நேர்காணல் குறிப்பிட்டது.
மருத்துவம், முதலீடு மற்றும் பிற தொழில்முறை வேலை சூழ்நிலைகள்
மருத்துவத்தில், டீப் ரிசர்ச் ஒரு குறிப்பிட்ட நோயின் அனைத்து இலக்கியங்களையும் அல்லது சமீபத்திய நிகழ்வுகளையும் கண்டுபிடிக்க உதவும், இதனால் நேரத்தை மிச்சப்படுத்தும்.
முதலீட்டில், டீப் ரிசர்ச்சின் உதவியுடன், முதலீட்டாளர்கள் தாங்கள் சந்திக்க நேரம் ஒதுக்கிய நிறுவனங்களை மட்டும் ஆராயாமல், தாங்கள் முதலீடு செய்யக்கூடிய ஒவ்வொரு சாத்தியமான ஸ்டார்ட்அப்பையும் ஆராய தேர்வு செய்யலாம்.
நிறுவன செயல்பாடுகளில், நுகர்வோர் பொருட்கள் நிறுவனத்தைத் தொடங்க நினைக்கும் ஒரு பயனர், குறிப்பிட்ட பிராண்ட் பெயர்கள் ஏற்கனவே பதிவு செய்யப்பட்டுள்ளதா, டொமைன் பெயர்கள் ஆக்கிரமிக்கப்பட்டுள்ளதா, சந்தை அளவு மற்றும் பல்வேறு பிற தகவல்களைத் தீர்மானிக்க டீப் ரிசர்ச்சை விரிவாகப் பயன்படுத்தி வருகிறார்.
ஷாப்பிங், பயணம் மற்றும் பிற குடும்ப சூழ்நிலைகள்
புதிய கார் வாங்க நினைக்கும் ஒரு பயனர் அடுத்த மாடல் எப்போது வெளியிடப்படும் என்பதை அறிய விரும்பினார். ஆன்லைனில் பல ஊகக் கட்டுரைகள் இருந்தன, எனவே பயனர் டீப் ரிசர்ச்சிடம் தொடர்புடைய அனைத்து வதந்திகளையும் தொகுக்குமாறு கேட்டார். டீப் ரிசர்ச் ஒரு சிறந்த அறிக்கையை உருவாக்கியது, அடுத்த சில மாதங்களில் ஒரு புதிய கார் வெளியிடப்படலாம் என்று பயனருக்குத் தெரிவித்தது.
ஜப்பானில் டீப் ரிசர்ச் தொடங்கப்பட்டபோது, குறிப்பிட்ட தேவைகளைப் பூர்த்தி செய்யும் உணவகங்களைக் கண்டுபிடிப்பதில் இது மிகவும் உதவியாக இருந்தது என்று பயனர்கள் கண்டறிந்தனர், மேலும் பயனர்கள் வேறுவிதமாக கண்டுபிடிக்காத விஷயங்களைக் கண்டறியவும் இது உதவும்.
பயனர்கள் ஒரு விலையுயர்ந்த பொருளை வாங்க வேண்டும், ஒரு சிறப்பு பயணத்தைத் திட்டமிட வேண்டும் அல்லது ஒரு சிக்கலைப் பற்றி யோசிக்க நிறைய நேரம் செலவிட வேண்டும் என்றால், அவர்கள் ஆன்லைனில் பல மணிநேரம் செலவழித்து தொடர்புடைய தகவல்களைத் தேடலாம், அனைத்து மதிப்புரைகளையும் உலாவலாம். டீப் ரிசர்ச் இந்த தகவலை விரைவாக ஒழுங்கமைக்கலாம், ஒரு சுருக்க அறிக்கையை உருவாக்கலாம் மற்றும் விரிவான மற்றும் தனிப்பயனாக்கப்பட்ட ஆலோசனைகளை வழங்கலாம்.
பிஸியான உழைக்கும் தாய்மார்களுக்கு பெரும்பாலும் தங்கள் குழந்தைகளுக்கு பிறந்தநாள் விழாக்களைத் திட்டமிட நேரம் இல்லை, ஆனால் இப்போது அவர்கள் டீப் ரிசர்ச்சின் உதவியுடன் அதை விரைவாகச் செய்ய முடியும்.
டீப் ரிசர்ச் அறிவுறுத்தல்களைப் பின்பற்றுவதிலும் சிறந்தது. பயனர்கள் ஒரு தயாரிப்பைப் பற்றி தெரிந்து கொள்ள விரும்புவது மட்டுமல்லாமல், அதை மற்ற எல்லா தயாரிப்புகளுடனும் ஒப்பிட விரும்பினால், அல்லது Reddit போன்ற வலைத்தளங்களிலிருந்து மதிப்புரைகளைப் பார்க்க விரும்பினால், அவர்கள் டீப் ரிசர்ச்சிற்கு பல வித்தியாசமான கோரிக்கைகளை வைக்கலாம், மேலும் அது இந்த பணிகளை அனைத்தையும் ஒரே நேரத்தில் முடிக்கும். பயனர்கள் டீப் ரிசர்ச்சிடம் தகவலை ஒரு அட்டவணையில் வைக்குமாறும் கேட்கலாம்.
நிரலாக்கம்
பலர் நிரலாக்கத்திற்கு டீப் ரிசர்ச்சைப் பயன்படுத்துகின்றனர். இந்த சூழ்நிலை ஆரம்பத்தில் OpenAI ஆல் கருதப்படவில்லை, ஆனால் பலர் குறியீட்டை எழுத, குறியீட்டைத் தேட, ஒரு தொகுப்புக்கான சமீபத்திய ஆவணங்களைக் கண்டுபிடிக்க அல்லது ஸ்கிரிப்ட்களை எழுத இதைப் பயன்படுத்துகின்றனர், ஈர்க்கக்கூடிய முடிவுகளுடன்.
கல்வி
தனிப்பயனாக்கப்பட்ட கல்வி மிகவும் சுவாரஸ்யமான பயன்பாட்டு சூழ்நிலை. பயனர்கள் உயிரியலை மதிப்பாய்வு செய்வது அல்லது நடப்பு நிகழ்வுகளைப் புரிந்துகொள்வது போன்ற ஒரு தலைப்பைக் கற்றுக்கொள்ள விரும்பினால், அவர்கள் தாங்கள் புரிந்து கொள்ளாத பகுதிகள் அல்லது அவர்கள் ஆழமாக ஆராய விரும்பும் தகவல்களை மட்டுமே வழங்க வேண்டும், மேலும் டீப் ரிசர்ச் ஒரு விரிவான அறிக்கையைத் தொகுக்க முடியும். ஒருவேளை எதிர்காலத்தில், டீப் ரிசர்ச் பயனரைப் பற்றி அறிந்துகொள்வதன் அடிப்படையில் தனிப்பயனாக்கப்பட்ட கல்வியை வழங்குவது சாத்தியமாகும்.
முகவர்கள் 2025 இல் தோன்றுவார்கள்
டீப் ரிசர்ச்சிற்கான எதிர்கால வளர்ச்சி திசைகள்
தயாரிப்பு வடிவத்தின் அடிப்படையில், டீப் ரிசர்ச் எதிர்காலத்தில் படங்களை உட்பொதிக்கவும், தயாரிப்புகளின் படங்களைக் கண்டறியவும், விளக்கப்படங்களை உருவாக்கவும், இந்த விளக்கப்படங்களை பதில்களில் உட்பொதிக்கவும் முடியும் என்று OpenAI நம்புகிறது.
தகவல் ஆதாரங்களின் அடிப்படையில், மாதிரி அணுகக்கூடிய தரவு ஆதாரங்களை விரிவாக்க OpenAI நம்புகிறது. எதிர்காலத்தில் மாதிரி தனிப்பட்ட தரவைத் தேட முடியும் என்று அவர்கள் நம்புகிறார்கள். OpenAI மாதிரியின் திறன்களை மேலும் மேம்படுத்தும், உலாவல் மற்றும் பகுப்பாய்வில் அதை சிறந்ததாக்கும்.
தகவல் துல்லியத்தின் அடிப்படையில், பயனர்கள் டீப் ரிசர்ச்சின் வெளியீட்டை நம்புவதற்கு, மாதிரி மேற்கோள் காட்டிய தகவலின் ஆதாரங்களை பயனர்கள் பார்க்கலாம். மாதிரி பயிற்சி செயல்பாட்டின் போது, OpenAI மேற்கோள்களின் சரியான தன்மையை உறுதிப்படுத்தவும் முயற்சிக்கிறது, ஆனால் மாதிரி இன்னும் தவறுகளைச் செய்யலாம், மாயத்தோற்றத்தை ஏற்படுத்தலாம் அல்லது மிகவும் நம்பகமானதாக இல்லாத ஒரு மூலத்தை நம்பலாம். எனவே, இது OpenAI தொடர்ந்து மேம்படுத்த விரும்பும் ஒரு பகுதி.
OpenAI முகவர் சாலை வரைபடத்தில் இன்னும் பரவலாக ஒருங்கிணைக்க, டீப் ரிசர்ச் பல வித்தியாசமான பயன்பாட்டு சூழ்நிலைகளுக்கு நீட்டிக்கப்படலாம் என்று OpenAI நம்புகிறது, மிகவும் மேம்பட்ட பகுத்தறிவு மாதிரிகளை மனிதர்கள் வேலை அல்லது அன்றாட வாழ்க்கை பணிகளை முடிக்க பயன்படுத்தக்கூடிய கருவிகளுடன் இணைத்து, பின்னர் பயனர்கள் முகவர் அடைய விரும்பும் முடிவுகளை அடைய மாதிரியை நேரடியாக உகந்ததாக்குகிறது.
இந்த கட்டத்தில், டீப் ரிசர்ச் மிகவும் சிக்கலான பணி சூழ்நிலைகளுக்கு விரிவடைவதை உண்மையில் எதுவும் தடுக்கவில்லை. AGI இப்போது ஒரு செயல்பாட்டு பிரச்சினை, மேலும் எதிர்காலத்தில் எதிர்நோக்க பல அற்புதமான முன்னேற்றங்கள் இருக்கும்.
Sam Altman டீப் ரிசர்ச் முடிக்கக்கூடிய பணிகள் உலகில் உள்ள அனைத்து பொருளாதார ரீதியாக சாத்தியமான பணிகளில் சில சதவீதமாக இருக்கும் என்று நம்புகிறார். Josh Tobin டீப் ரிசர்ச் பயனர்களுக்காக எல்லா வேலைகளையும் செய்ய முடியாது என்று நம்புகிறார், ஆனால் அது பயனர்களுக்கு பல மணிநேரங்கள் அல்லது நாட்களை கூட சேமிக்க முடியும். டீப் ரிசர்ச் மற்றும் அடுத்து கட்டப்படும் முகவர்கள், அதே போல் இந்த அடித்தளத்தில் கட்டப்பட்ட பிற முகவர்கள், பயனர்கள் செய்யும் வேலையின் வகையைப் பொறுத்து, அவர்களின் நேரத்தில் 1%, 5%, 10% அல்லது 25% சேமிக்க முடியும் என்பது ஒப்பீட்டளவில் நெருக்கமான இலக்கு என்று OpenAI நம்புகிறது.
முகவர் & RL
Isa Fulford மற்றும் Josh Tobin முகவர்கள் இந்த ஆண்டு தோன்றுவார்கள் என்பதை ஒப்புக்கொள்கிறார்கள்.
RL ஒரு உச்சத்தை அனுபவித்தது, பின்னர் சிறிது தொட்டியைப் போலத் தோன்றியது, இப்போது மீண்டும் கவனத்தைப் பெறுகிறது. Yann LeCun ஒருமுறை ஒரு ஒப்புமை வைத்திருந்தார்: மக்கள் ஒரு கேக் தயாரிக்கிறார்கள் என்றால், அதில் பெரும்பாலானவை கேக், சிறிது உறைபனி இருக்கும், இறுதியாக மேலே சில செர்ரிகள் இருக்கும். மேற்பார்வை செய்யப்படாத கற்றல் கேக் போன்றது, மேற்பார்வையிடப்பட்ட கற்றல் உறைபனி, மற்றும் RL செர்ரி.
Josh Tobin 2015-2016 இல் RL செய்யும் போது, கேக் ஒப்புமையைப் பயன்படுத்தி, அது கேக் இல்லாமல் செர்ரியைச் சேர்க்க முயற்சிப்பதாக இருக்கலாம் என்று நம்புகிறார். ஆனால் இப்போது, அதிக அளவு தரவுகளில் முன் பயிற்சி பெற்ற மொழி மாதிரிகள் உள்ளன, இந்த மாதிரிகள் மிகவும் சக்திவாய்ந்தவை, மேலும் இந்த மொழி மாதிரிகளில் மேற்பார்வையிடப்பட்ட நன்றாக ட்யூனிங்கை எவ்வாறு செய்வது என்று எங்களுக்குத் தெரியும், அவை அறிவுறுத்தல்களைச் செயல்படுத்துவதிலும் மக்கள் விரும்புவதை செய்வதிலும் சிறந்தவை. இப்போது எல்லாம் நன்றாக வேலை செய்கிறது, மேலும் எந்தவொரு பயன்பாட்டு நிகழ்விற்கும் பயனர் வரையறுக்கப்பட்ட வெகுமதி செயல்பாடுகளின்படி இந்த மாதிரிகளை சரிசெய்வது மிகவும் பொருத்தமானது.