செயற்கை நுண்ணறிவு மேலாதிக்கத்திற்கான இடைவிடாத பந்தயத்தில், தலைசுற்ற வைக்கும் அதிர்வெண்ணில் புதிய கண்டுபிடிப்புகள் அறிவிக்கப்படும் நிலையில், இயந்திரங்களின் பகுத்தறியும் திறன் ஒரு வலிமையான எல்லையாக உள்ளது. ஒரு Large Language Model (LLM) ஒரு வாக்கியத்தில் அடுத்த வார்த்தையை கணிப்பது ஒரு விஷயம்; அது ஒரு தர்க்கரீதியான பாதையைப் பின்பற்றுவது, அதன் சொந்த வெளியீட்டை விமர்சிப்பது மற்றும் சரியான முடிவுகளுக்கு வருவது என்பது முற்றிலும் வேறுபட்டது, குறிப்பாக புதிய அல்லது சிக்கலான கேள்விகளை எதிர்கொள்ளும்போது. இந்த பின்னணியில், வேகமாக வளர்ந்து வரும் சீன AI ஸ்டார்ட்அப் ஆன DeepSeek-இன் சமீபத்திய வெளிப்பாடு கவனத்தை ஈர்க்கிறது. ஏற்கனவே அதன் முந்தைய மாடல் வெளியீடுகளால் கவனத்தை ஈர்த்துள்ள இந்நிறுவனம், LLM-களின் பகுத்தறியும் திறனை கணிசமாக வலுப்படுத்த வடிவமைக்கப்பட்ட ஒரு அதிநவீன புதிய நுட்பத்தை வெளியிட்டுள்ளது. இந்த அறிவிப்பு, அதன் அடுத்த தலைமுறை AI மாடலின் உடனடி வருகை பற்றிய வதந்திகள் தீவிரமடையும் நேரத்தில் வந்துள்ளது.
இது மற்றொரு படிப்படியான மாற்றம் மட்டுமல்ல. DeepSeek, Tsinghua பல்கலைக்கழகத்தின் மதிப்புமிக்க ஆராய்ச்சியாளர்களுடன் இணைந்து - இந்தத் துறையில் வணிக லட்சியத்திற்கும் கல்விசார் கடுமைக்கும் இடையிலான முக்கிய ஒருங்கிணைப்பை எடுத்துக்காட்டும் ஒரு கூட்டாண்மை - ஒரு புதினமான இரட்டை முனை மூலோபாயத்தை விவரித்துள்ளது. இந்த அணுகுமுறை Generative Reward Modeling (GRM) மற்றும் சுய-கொள்கை விமர்சன சரிசெய்தல் (self-principled critique tuning) ஆகியவற்றை புத்திசாலித்தனமாக ஒன்றிணைக்கிறது. ஆன்லைன் களஞ்சியமான arXiv-இல் அமைதியாக வெளியிடப்பட்ட ஒரு தொழில்நுட்பக் கட்டுரையில் கோடிட்டுக் காட்டப்பட்டுள்ளபடி, இதன் நோக்கம் லட்சியமானது ஆனால் முக்கியமானது: பரந்த அளவிலான பொதுவான தூண்டுதல்களுக்கு மிகவும் துல்லியமாக பதிலளிப்பது மட்டுமல்லாமல், அதிக செயல்திறனுடன் அவ்வாறு செய்யும் LLM-களை வளர்ப்பது.
இரட்டை அணுகுமுறையை பிரித்தல்: GRM சுய-விமர்சனத்தை சந்திக்கிறது
DeepSeek-இன் புதுமையின் சாத்தியமான தாக்கத்தைப் புரிந்து கொள்ள, இந்த இரண்டு கூறுகளையும் பிரித்து அவற்றின் ஒருங்கிணைந்த சக்தியைப் பாராட்ட வேண்டும். AI உலகம் ஏற்கனவே வெகுமதி மாதிரியாக்கத்துடன் (reward modeling) பரிச்சயமானது, இது பெரும்பாலும் Reinforcement Learning from Human Feedback (RLHF) உடன் தொடர்புடைய ஒரு மூலக்கல்லான நுட்பமாகும். வழக்கமான RLHF-இல், மனித மதிப்பாய்வாளர்கள் வெவ்வேறு AI-உருவாக்கிய பதில்களை மதிப்பிடுகிறார்கள், எந்த வகையான வெளியீடுகள் விரும்பப்படுகின்றன என்பதை மாதிரிக்கு திறம்பட கற்பிக்கிறார்கள். இந்த பின்னூட்ட வளையம் மாதிரியை மனித மதிப்புகள் மற்றும் எதிர்பார்ப்புகளுடன் சீரமைக்க உதவுகிறது. இருப்பினும், இந்த செயல்முறை உழைப்பு மிகுந்ததாகவும், விலை உயர்ந்ததாகவும், மனித பின்னூட்டத்தின் அளவு மற்றும் நிலைத்தன்மையால் கட்டுப்படுத்தப்பட்டதாகவும் இருக்கலாம்.
DeepSeek பின்பற்றும் Generative Reward Modeling (GRM), ஒரு சாத்தியமான அளவிடக்கூடிய மற்றும் நுணுக்கமான பரிணாமத்தை பிரதிநிதித்துவப்படுத்துவதாகத் தோன்றுகிறது. விருப்பத்தைக் குறிக்கும் ஒரு ஸ்கேலார் ‘வெகுமதி’ மதிப்பெண்ணைக் கற்றுக்கொள்வதற்குப் பதிலாக, ஒரு GRM அணுகுமுறை ஒரு பதில் மற்றொன்றை விட ஏன் சிறந்தது என்பதற்கான விளக்கங்கள் அல்லது நியாயங்களை உருவாக்க ஒரு மாதிரியைப் பயிற்றுவிப்பதை உள்ளடக்கியிருக்கலாம். இது விருப்பமான விளைவுகளை அங்கீகரிப்பதை விட, நல்ல பதில்களின் அடிப்படை கொள்கைகளை கற்றுக்கொள்கிறது. இந்த உருவாக்கும் திறன், வெகுமதி மாதிரியே LLM-இன் பயிற்சி செயல்முறையின் போது பணக்கார, அதிக தகவல் தரும் பின்னூட்டத்தை வழங்க அனுமதிக்கலாம். உங்கள் பதில் ‘நல்லது’ என்று சொல்லப்படுவது மட்டுமல்லாமல், தெளிவு, உண்மைத் துல்லியம், தர்க்கரீதியான நிலைத்தன்மை மற்றும் உதவி போன்ற அம்சங்களை உள்ளடக்கிய ஏன் அது நல்லது என்பதற்கான விரிவான விளக்கத்தைப் பெறுவதை கற்பனை செய்து பாருங்கள். ஒரு GRM இந்த வகையான விரிவான பின்னூட்டத்தை தானியக்கமாக்கலாம் அல்லது அதிகரிக்கலாம், எளிய விருப்ப மதிப்பெண்களுக்கு அப்பால் செல்லலாம். DeepSeek கட்டுரை, அவர்களின் GRM மாதிரிகள் ஏற்கனவே நிறுவப்பட்ட பொது வெகுமதி மாதிரிகளுடன் ஒப்பிடும்போது ‘போட்டி செயல்திறனை’ வெளிப்படுத்தியுள்ளன என்று கூறுகிறது, இது இந்த உருவாக்கும் முறையின் நம்பகத்தன்மை மற்றும் சக்தியை சுட்டிக்காட்டுகிறது. இந்த நெரிசலான துறையில் எந்தவொரு புதிய நுட்பத்திற்கும் வலுவான, பரவலாகப் பயன்படுத்தப்படும் வரையறைகளுடன் சமநிலையை அடைவது ஒரு குறிப்பிடத்தக்க சரிபார்ப்பு புள்ளியாகும்.
GRM-ஐ பூர்த்தி செய்வது சுய-கொள்கை விமர்சன சரிசெய்தல் (self-principled critique tuning) என்ற கருத்து. இந்த உறுப்பு LLM-இன் சுத்திகரிப்பு செயல்முறைக்குள் ஒரு உள்நோக்க திறனை அறிமுகப்படுத்துகிறது. மாதிரி வெறுமனே பின்னூட்டத்தைப் பெறுவது மட்டுமல்ல (மனிதர்களிடமிருந்தோ அல்லது GRM-இடமிருந்தோ), ஆனால் அது கற்றுக்கொண்ட கொள்கைகளின் தொகுப்பின் அடிப்படையில் அதன் சொந்த வெளியீடுகளை தீவிரமாக மதிப்பீடு செய்கிறது என்று இது அறிவுறுத்துகிறது. இந்த ‘கொள்கைகள்’ தர்க்க விதிகள், நெறிமுறை வழிகாட்டுதல்கள், உண்மை அடிப்படையிலான தேவைகள் அல்லது குறிப்பிட்ட பாணி கட்டுப்பாடுகளை உள்ளடக்கியிருக்கலாம். ‘சுய-விமர்சனம்’ அம்சம் ஒரு உள் பின்னூட்ட வளையத்தை குறிக்கிறது, அங்கு மாதிரி அதன் சொந்த உருவாக்கப்பட்ட உரையில் உள்ள குறைபாடுகள் அல்லது குறைகளைக் கண்டறிந்து, பின்னர் இந்த வேரூன்றிய கொள்கைகளால் வழிநடத்தப்பட்டு அவற்றை சரிசெய்ய முயற்சிக்கிறது. ‘சரிசெய்தல்’ (Tuning) என்பது இந்த சுய மதிப்பீட்டின் அடிப்படையில் மாதிரியின் அளவுருக்களை சரிசெய்யும் செயல்முறையைக் குறிக்கிறது.
GRM மற்றும் சுய-கொள்கை விமர்சன சரிசெய்தல் ஆகியவற்றுக்கு இடையேயான ஒருங்கிணைப்பு குறிப்பாக சக்திவாய்ந்ததாக இருக்கலாம். GRM உயர்தர பதிலை எது உருவாக்குகிறது என்பதற்கான ஒரு அதிநவீன புரிதலை வழங்குகிறது, இது சுய-விமர்சன பொறிமுறை பயன்படுத்தும் கொள்கைகளையே உருவாக்கக்கூடும். சுய-விமர்சன பொறிமுறை பின்னர் இந்த கொள்கைகளை உருவாக்கம் அல்லது சுத்திகரிப்பின் போது மாறும் வகையில் பயன்படுத்துகிறது, இது மாதிரியை அதன் சொந்த பகுத்தறிவு மற்றும் வெளியீட்டு தரத்தை படிப்படியாக மேம்படுத்த அனுமதிக்கிறது. இந்த உள் தரக் கட்டுப்பாடு பயிற்சியின் போது விரைவான ஒருங்கிணைப்புக்கும், பயன்பாட்டின் போது அதிக நம்பகமான செயல்திறனுக்கும் வழிவகுக்கும், இது தற்போதைய LLM-களுக்கான தொடர்ச்சியான சவால்களான மாயத்தோற்றம் அல்லது தர்க்கரீதியான தவறுகளுக்கான மாதிரியின் போக்கை குறைக்கக்கூடும். இது AI க்குள் ஒரு வகையான அறிவாற்றல் சுய-திருத்தத்தை வளர்க்கிறது, இது மனித நுண்ணறிவுடன் நாம் தொடர்புபடுத்தும் நெகிழ்வான, தகவமைக்கக்கூடிய பகுத்தறிவுக்கு நெருக்கமாக நகர்த்துகிறது.
செயல்திறன், வாக்குறுதிகள் மற்றும் நிலைப்படுத்தல்
புதிதாக உருவாக்கப்பட்ட DeepSeek-GRM மாதிரிகள் ‘போட்டி செயல்திறனை’ அடைகின்றன என்ற கூற்று, இயற்கையாகவே, ஒரு மையப் புள்ளியாகும். கல்விசார் கட்டுரை குறிப்பிட்ட வரையறைகள் மற்றும் ஒப்பீடுகளை வழங்க வாய்ப்பிருந்தாலும், பரந்த உட்குறிப்பு என்னவென்றால், இந்த புதினமான நுட்பம் வெறும் தத்துவார்த்த ஆர்வம் அல்ல; இது LLM பகுத்தறிவு மற்றும் சீரமைப்பை மேம்படுத்துவதற்கான தற்போதைய அதிநவீன முறைகளுடன் ஒப்பிடக்கூடிய முடிவுகளை வழங்குகிறது. உலகளாவிய AI சந்தையில் கணிசமான பங்கை வென்றெடுக்க DeepSeek முயற்சிப்பதால் இது முக்கியமானது. உறுதியான செயல்திறன் ஆதாயங்களை நிரூபிப்பது அவர்களின் ஆராய்ச்சி திசையை சரிபார்க்கிறது மற்றும் அவர்களின் மதிப்பு முன்மொழிவை பலப்படுத்துகிறது.
மேலும், இறுதியில் GRM மாதிரிகளை திறந்த மூலமாக (open-source) மாற்றும் DeepSeek-இன் கூறப்பட்ட நோக்கம் ஒரு மூலோபாய ரீதியாக குறிப்பிடத்தக்க நடவடிக்கையாகும். தனியுரிம, மூடிய மாதிரிகள் பெரும்பாலும் தலைப்புச் செய்திகளில் ஆதிக்கம் செலுத்தும் ஒரு சுற்றுச்சூழல் அமைப்பில், சக்திவாய்ந்த கருவிகளை ஆராய்ச்சி சமூகத்திற்குத் திரும்பக் கொடுப்பது கணிசமான நன்மைகளைத் தரும். திறந்த மூலமாக்கல் மற்ற ஆராய்ச்சியாளர்களை மாதிரிகளை உருவாக்கவும், ஆராயவும், மேம்படுத்தவும் அனுமதிப்பதன் மூலம் புதுமையை துரிதப்படுத்த முடியும். இது நல்லெண்ணத்தை வளர்க்கிறது, திறமைகளை ஈர்க்கிறது, மேலும் DeepSeek-இன் முறைகளை துறையில் ஒரு சாத்தியமான தரநிலை அல்லது செல்வாக்குமிக்க அணுகுமுறையாக நிறுவ உதவும். இது Meta (Llama மாதிரிகள்) மற்றும் Mistral AI போன்ற வீரர்களுடன் காணப்பட்ட வளர்ந்து வரும் போக்குடன் ஒத்துப்போகிறது, அவர்கள் வலுவான சமூக ஈடுபாட்டைக் கட்டியெழுப்பவும், பதவியில் இருப்பவர்களுக்கு சவால் விடவும் திறந்த மூல வெளியீடுகளைப் பயன்படுத்தியுள்ளனர். இருப்பினும், வெளியீட்டிற்கான ஒரு குறிப்பிட்ட காலக்கெடு இல்லாதது விருப்பங்களைத் திறந்து வைக்கிறது, இது DeepSeek-ஐ மேலும் மாதிரிகளைச் செம்மைப்படுத்த அல்லது வெளியீட்டை மூலோபாய ரீதியாக ஒருங்கிணைக்க அனுமதிக்கிறது, ஒருவேளை அவர்களின் எதிர்பார்க்கப்படும் அடுத்த தலைமுறை அடித்தள மாதிரியுடன் இணைந்து.
இந்த ஆராய்ச்சி அறிவிப்பு ஒரு வெற்றிடத்தில் நிகழவில்லை. DeepSeek-இன் அடுத்த பெரிய தயாரிப்பு வெளியீட்டைச் சுற்றியுள்ள தெளிவான எதிர்பார்ப்புகளுக்கு மத்தியில் இது வருகிறது. நிறுவனம் அதன் DeepSeek-V3 அடித்தள மாதிரி மற்றும் குறிப்பாக அதன் DeepSeek-R1 பகுத்தறிவு மாதிரி மூலம் குறிப்பிடத்தக்க சர்வதேச கவனத்தைப் பெற்றது. R1 மாதிரி முதன்மையாக அதன் கணக்கீட்டுச் செலவுடன் ஒப்பிடும்போது அதன் ஈர்க்கக்கூடிய செயல்திறன் காரணமாக அலைகளை உருவாக்கியது - இது முன்னணி உலகளாவிய மாடல்களுக்கு போட்டியாக இருக்கும் திறன்களை வழங்கியது, ஆனால் அதிக செயல்திறனுடன். பெரிய அளவிலான AI-இன் வளம் மிகுந்த உலகில், செலவு-செயல்திறன் ஒரு சக்திவாய்ந்த வேறுபடுத்தியாகும், இது பரந்த அளவிலான டெவலப்பர்கள் மற்றும் நிறுவனங்களுக்கு ஈர்க்கிறது.
தொழில்துறை பார்வையாளர்கள், Reuters-இன் படி நிறுவனத்தின் திட்டங்களை நன்கு அறிந்த ஆதாரங்களை மேற்கோள் காட்டி, ஈர்க்கக்கூடிய R1-இன் வாரிசான DeepSeek-R2, விரைவில், ஒருவேளை இந்த மாதத்திற்குள் கூட வெளியிடப்படலாம் என்று ஊகிக்கின்றனர். DeepSeek ஒரு கார்ப்பரேட் போக்கர் முகத்தை பராமரிக்கும் போது, இந்த வதந்திகளை உறுதிப்படுத்தவோ அல்லது மறுக்கவோ இல்லை என்றாலும், GRM ஆராய்ச்சி வெளியீட்டின் நேரம் நிச்சயமாக ஊக நெருப்பைத் தூண்டுகிறது. GRM மற்றும் சுய-விமர்சன சரிசெய்தல் மூலம் அடையப்பட்ட பகுத்தறியும் திறன்களில் ஏற்பட்ட முன்னேற்றங்கள் வெறும் கல்விப் பயிற்சிகள் அல்ல, ஆனால் R2-க்காக திட்டமிடப்பட்ட கட்டமைப்பு மற்றும் செயல்திறன் மேம்பாடுகளுக்கு ஒருங்கிணைந்தவை என்பதை இது வலுவாகக் கூறுகிறது. R2 இந்த அதிநவீன பகுத்தறிவு பொறிமுறையை இணைத்தால், அது ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கலாம், வணிக ரீதியாகக் கிடைக்கும் மாடல்களிடையே பகுத்தறிவுப் பணிகளுக்கான புதிய வரையறையை அமைக்கலாம், குறிப்பாக அது அதன் முன்னோடியின் செலவு-செயல்திறன் DNA-வை பராமரித்தால்.
AI அறிவாற்றலுக்கான பரந்த தேடல்
DeepSeek-இன் பணி AI வளர்ச்சியின் மிக முக்கியமான மற்றும் சவாலான பகுதிகளில் ஒன்றைத் தட்டுகிறது: பகுத்தறியும் திறன்களை மேம்படுத்துதல். ஆரம்பகால LLM-கள் பரந்த தரவுத்தொகுப்புகளிலிருந்து கற்றுக்கொண்ட புள்ளிவிவர தொடர்புகளின் அடிப்படையில் மாதிரி அங்கீகாரம் மற்றும் உரை உருவாக்கத்தில் சிறந்து விளங்கின. இருப்பினும், உண்மையான பகுத்தறிவு - பல-படி தர்க்கரீதியான கழித்தல், காரண காரிய அனுமானம், எதிர்நடப்பு சிந்தனை, திட்டமிடல் மற்றும் வலுவான சுய-திருத்தம் ஆகியவற்றை உள்ளடக்கியது - மிகவும் மழுப்பலாக நிரூபிக்கப்பட்டுள்ளது. மாதிரிகள் பெரும்பாலும் சிக்கலான கணித சிக்கல்கள், சிக்கலான தர்க்க புதிர்கள், அறிவியல் கருதுகோள் உருவாக்கம் மற்றும் மேலோட்டமான மாதிரிப் பொருத்தத்திற்குப் பதிலாக ஆழமான புரிதல் தேவைப்படும் பணிகளுடன் போராடுகின்றன. அவை உண்மைக்குப் புறம்பான அல்லது தர்க்கரீதியாக குறைபாடுள்ள (மாயத்தோற்றங்கள்) நம்பத்தகுந்ததாகத் தோன்றும் உரையை உருவாக்க முடியும்.
பகுத்தறிவை மேம்படுத்துவது மிக முக்கியமானது, ஏனெனில் இது பல்வேறு களங்களில் உண்மையான சிக்கலான சிக்கல்களைச் சமாளிக்க AI-இன் திறனைத் திறக்கிறது:
- அறிவியல் கண்டுபிடிப்பு: ஆராய்ச்சியாளர்களுக்கு கருதுகோள்களை உருவாக்கவும், சிக்கலான தரவை பகுப்பாய்வு செய்யவும், சோதனைகளை வடிவமைக்கவும் உதவுதல்.
- மென்பொருள் மேம்பாடு: நிரல் தர்க்கத்தைப் புரிந்துகொள்வதற்கும், சிக்கலான பிழைகளை சரிசெய்வதற்கும், வலுவான மென்பொருள் கட்டமைப்புகளை வடிவமைப்பதற்கும் குறியீடு நிறைவுக்கு அப்பால் செல்வது.
- மருத்துவம்: மருத்துவர்களுக்கு அரிதான நோய்களைக் கண்டறியவும், சிக்கலான நோயாளி வரலாறுகளைப் புரிந்துகொள்ளவும், மருத்துவ ஆராய்ச்சியை பகுப்பாய்வு செய்யவும் உதவுதல்.
- கல்வி: மாணவர் பகுத்தறிவு செயல்முறைகளைப் புரிந்துகொண்டு வடிவமைக்கப்பட்ட வழிகாட்டுதலை வழங்கும் உண்மையான தகவமைப்பு ஆசிரியர்களை உருவாக்குதல்.
- வணிக உத்தி: சிக்கலான சந்தை இயக்கவியலை பகுப்பாய்வு செய்தல், காட்சிகளை உருவகப்படுத்துதல் மற்றும் சிக்கலான முடிவெடுப்பதில் உதவுதல்.
தொழில்துறை இந்த பகுத்தறிவு இடைவெளியைக் குறைக்க பல வழிகளை ஆராய்ந்து வருகிறது. Chain-of-thought (CoT) தூண்டுதல், மாதிரிகளை இடைநிலை பகுத்தறிவு படிகளை உருவாக்குவதன் மூலம் ‘அவற்றின் வேலையைக் காட்ட’ ஊக்குவிக்கிறது, இது பெரும்பாலும் சிக்கலான பணிகளில் செயல்திறனை மேம்படுத்துகிறது. Tree-of-thoughts (ToT) இதை விரிவுபடுத்துகிறது, மாதிரிகள் ஒரே நேரத்தில் பல பகுத்தறிவு பாதைகளை ஆராயவும் அவற்றை மதிப்பீடு செய்யவும் அனுமதிக்கிறது. பிற அணுகுமுறைகள் LLM-களை கால்குலேட்டர்கள், குறியீடு மொழிபெயர்ப்பாளர்கள் அல்லது குறியீட்டு பகுத்தறிவாளர்கள் போன்ற வெளிப்புற கருவிகளுடன் ஒருங்கிணைப்பதை உள்ளடக்குகின்றன, இது LLM குறிப்பிட்ட பணிகளை சிறப்பு தொகுதிகளுக்கு மாற்றுவதற்கு அனுமதிக்கிறது. Mixture-of-Experts (MoE) மாதிரிகள் போன்ற கட்டமைப்பு புதுமைகள், நெட்வொர்க்கின் சிறப்புப் பகுதிகளை வெவ்வேறு பணிகளுக்கு அர்ப்பணிப்பதை நோக்கமாகக் கொண்டுள்ளன, இது பகுத்தறிவு கவனத்தை மேம்படுத்தக்கூடும்.
DeepSeek-இன் GRM மற்றும் சுய-கொள்கை விமர்சன சரிசெய்தல் ஆகியவை இந்த வளமான ஆராய்ச்சித் திரையில் மற்றொரு குறிப்பிடத்தக்க இழையைக் குறிக்கின்றன. LLM-இன் உள் பின்னூட்ட வழிமுறைகள் மற்றும் சுய மதிப்பீட்டு திறன்களை மேம்படுத்துவதில் கவனம் செலுத்துவதன் மூலம், இது அறிவாற்றல் நம்பகத்தன்மையை மேம்படுத்துவதற்கான ஒரு சாத்தியமான ஒருங்கிணைந்த மற்றும் முழுமையான அணுகுமுறையை வழங்குகிறது. இது மாதிரியை சிறந்த பதில்களை நோக்கி வழிநடத்துவது மட்டுமல்லாமல், சில பதில்கள் ஏன் சிறந்தவை என்பதற்கான ஆழமான புரிதலை அதனுள் புகுத்துவதை நோக்கமாகக் கொண்டுள்ளது, இது செயற்கை பகுத்தறிவின் மிகவும் வலுவான மற்றும் நம்பகமான வடிவத்தை வளர்க்கிறது.
DeepSeek அதன் சாத்தியமான அடுத்த கட்டத்திற்கு R2 உடன் தயாராகும்போது, இந்த புதினமான பகுத்தறிவு நுட்பத்துடன் ஆயுதம் ஏந்திய நிலையில், பங்குகள் அதிகமாக உள்ளன. நிறுவனம் ஒரு கடுமையான போட்டி நிலப்பரப்பில் பயணிக்கிறது, நிறுவப்பட்ட தொழில்நுட்ப ஜாம்பவான்கள் மற்றும் உலகெங்கிலும் உள்ள சுறுசுறுப்பான ஸ்டார்ட்அப்கள் மற்றும் சீனாவின் வளர்ந்து வரும் AI காட்சியில் உள்ள சக்திவாய்ந்த உள்நாட்டு போட்டியாளர்களுடன் மோதுகிறது. வெற்றி தொழில்நுட்ப வலிமையை மட்டுமல்ல, மூலோபாய நிலைப்படுத்தல், சந்தை தழுவல் மற்றும் நம்பகமான, அளவிடக்கூடிய மற்றும் ஒருவேளை முக்கியமாக, செலவு குறைந்த AI தீர்வுகளை வழங்கும் திறனையும் சார்ந்துள்ளது. அவர்களின் மேம்பட்ட பகுத்தறிவு முறையின் வெளியீடு, AI பந்தயத்தில் ஒரு பங்கேற்பாளராக இருப்பதை விட அதிகமாக இருக்க வேண்டும் என்ற DeepSeek-இன் லட்சியத்தின் தெளிவான சமிக்ஞையாகும் - அவர்கள் ஒரு வேகத்தை அமைப்பவர்களாக இருக்க வேண்டும், குறிப்பாக இயந்திரங்களை ஆழமாகவும் நம்பகத்தன்மையுடனும் சிந்திக்க வைக்கும் முக்கியமான களத்தில். வரவிருக்கும் வாரங்களும் மாதங்களும் இந்த புதிய நுட்பம், DeepSeek-R2-இல் பொதிந்திருக்கக்கூடியது, கல்வி வாக்குறுதியை சந்தையை சீர்குலைக்கும் செயல்திறனாக மாற்ற முடியுமா என்பதை தீர்மானிப்பதில் முக்கிய பங்கு வகிக்கும்.