செயற்கை நுண்ணறிவுத் துறையில் இடைவிடாத கண்டுபிடிப்புகளின் வேகம், திருப்தி அடைவதற்கு ஒருபோதும் இடமளிக்காது என்பதை உறுதி செய்கிறது. நிலைபெற்ற வழிமுறைகள் உறுதியாகத் தோன்றும்போது, புதிய முன்னேற்றங்கள் தற்போதைய நிலையை சவால் செய்ய வெளிவருகின்றன. 2025 ஆம் ஆண்டின் தொடக்கத்தில், அதிகம் அறியப்படாத சீன AI ஆய்வகமான DeepSeek, ஒரு மாதிரியை வெளியிட்டபோது ஒரு சிறந்த உதாரணம் வந்தது. அது கவனத்தை ஈர்த்தது மட்டுமல்லாமல், நிதிச் சந்தைகளில் உணரக்கூடிய நடுக்கங்களை அனுப்பியது. இந்த அறிவிப்பைத் தொடர்ந்து Nvidia-வின் பங்கு விலையில் 17% வீழ்ச்சி ஏற்பட்டது, இது வளர்ந்து வரும் AI தரவு மைய சூழலியல் அமைப்புடன் தொடர்புடைய பிற நிறுவனங்களையும் கீழே இழுத்தது. முன்னணி அமெரிக்க ஆராய்ச்சி ஆய்வகங்களுடன் பொதுவாக தொடர்புடைய பெரிய வரவு செலவுத் திட்டங்கள் இல்லாமல், உயர் திறன் கொண்ட AI மாதிரிகளை உருவாக்குவதில் DeepSeek வெளிப்படுத்திய திறமைக்கு இந்த கூர்மையான எதிர்வினையை சந்தை வர்ணனையாளர்கள் விரைவாகக் காரணம் காட்டினர். இந்த நிகழ்வு AI உள்கட்டமைப்பின் எதிர்கால கட்டமைப்பு மற்றும் பொருளாதாரம் குறித்த தீவிர விவாதத்தை உடனடியாகத் தூண்டியது.
DeepSeek-ன் வருகையால் அறிவிக்கப்பட்ட சாத்தியமான இடையூறுகளை முழுமையாகப் புரிந்து கொள்ள, அதை ஒரு பரந்த சூழலில் வைப்பது முக்கியம்: AI மேம்பாட்டுப் பாதையில் உருவாகி வரும் தடைகள். தொழில்துறையின் போக்கைப் பாதிக்கும் ஒரு குறிப்பிடத்தக்க காரணி, உயர்தர, புதிய பயிற்சித் தரவுகளின் வளர்ந்து வரும் பற்றாக்குறை ஆகும். AI துறையில் உள்ள முக்கிய வீரர்கள், இப்போது, தங்கள் அடிப்படை மாதிரிகளைப் பயிற்றுவிப்பதற்காக பொதுவில் கிடைக்கும் இணையத் தரவுகளின் பரந்த பகுதிகளை உட்கொண்டுள்ளனர். இதன் விளைவாக, எளிதில் அணுகக்கூடிய தகவல்களின் ஊற்று வற்றத் தொடங்குகிறது, இது பாரம்பரிய முன்-பயிற்சி முறைகள் மூலம் மாதிரி செயல்திறனில் மேலும் குறிப்பிடத்தக்க முன்னேற்றங்களை அடைவதை கடினமாகவும் செலவு மிக்கதாகவும் ஆக்குகிறது. இந்த வளர்ந்து வரும் இடையூறு ஒரு மூலோபாய மாற்றத்தை கட்டாயப்படுத்துகிறது. மாதிரி உருவாக்குநர்கள் ‘test-time compute’ (TTC)-யின் திறனை அதிகளவில் ஆராய்ந்து வருகின்றனர். இந்த அணுகுமுறை, inference கட்டத்தின் போது ஒரு மாதிரியின் பகுத்தறியும் திறன்களை மேம்படுத்துவதை வலியுறுத்துகிறது - அடிப்படையில், ஒரு வினவல் முன்வைக்கப்படும்போது, அதன் முன்-பயிற்சி பெற்ற அறிவை மட்டுமே நம்பியிருக்காமல், அதன் பதிலை ‘சிந்தித்து’ செம்மைப்படுத்த அதிக கணக்கீட்டு முயற்சியை அர்ப்பணிக்க மாதிரியை அனுமதிக்கிறது. TTC ஒரு புதிய அளவிடுதல் முன்னுதாரணத்தைத் திறக்கக்கூடும் என்ற நம்பிக்கை ஆராய்ச்சி சமூகத்தில் வளர்ந்து வருகிறது, இது முன்னர் முன்-பயிற்சி தரவு மற்றும் அளவுருக்களை அதிகரிப்பதன் மூலம் அடையப்பட்ட வியத்தகு செயல்திறன் ஆதாயங்களைப் பிரதிபலிக்கக்கூடும். inference-நேர செயலாக்கத்தில் இந்த கவனம், செயற்கை நுண்ணறிவில் மாற்றத்தக்க முன்னேற்றங்களுக்கான அடுத்த எல்லையை நன்கு பிரதிநிதித்துவப்படுத்தலாம்.
இந்த சமீபத்திய நிகழ்வுகள் AI நிலப்பரப்பில் நடந்து வரும் இரண்டு அடிப்படை மாற்றங்களைக் குறிக்கின்றன. முதலாவதாக, ஒப்பீட்டளவில் சிறிய, அல்லது குறைந்தபட்சம் பொதுவில் அறிவிக்கப்படாத, நிதி ஆதாரங்களுடன் செயல்படும் நிறுவனங்கள் இப்போது அதிநவீனத்துடன் போட்டியிடக்கூடிய மாதிரிகளை உருவாக்கி பயன்படுத்த முடியும் என்பது தெளிவாகிறது. பாரம்பரியமாக ஒரு சில அதிக நிதி பெற்ற ஜாம்பவான்களால் ஆதிக்கம் செலுத்தப்பட்ட களம் சமன் செய்யப்படுவதாகத் தெரிகிறது. இரண்டாவதாக, எதிர்கால AI முன்னேற்றத்திற்கான முதன்மை இயந்திரமாக inference புள்ளியில் (TTC) கணக்கீட்டை மேம்படுத்துவதில் மூலோபாய முக்கியத்துவம் தீர்க்கமாக மாறுகிறது. இந்த இரண்டு முக்கிய போக்குகளையும் ஆழமாக ஆராய்ந்து, போட்டி, சந்தை இயக்கவியல் மற்றும் பரந்த AI சூழலியல் அமைப்பில் உள்ள பல்வேறு பிரிவுகளுக்கான அவற்றின் சாத்தியமான விளைவுகளை ஆராய்வோம்.
வன்பொருள் நிலப்பரப்பை மறுவடிவமைத்தல்
test-time compute நோக்கிய மூலோபாய மறுசீரமைப்பு, AI புரட்சிக்கு அடித்தளமாக இருக்கும் வன்பொருளுக்கு ஆழமான தாக்கங்களைக் கொண்டுள்ளது, இது GPUs, சிறப்பு சிலிக்கான் மற்றும் ஒட்டுமொத்த கணக்கீட்டு உள்கட்டமைப்புக்கான தேவைகளை மறுவடிவமைக்கக்கூடும். இந்த மாற்றம் பல முக்கிய வழிகளில் வெளிப்படக்கூடும் என்று நாங்கள் நம்புகிறோம்:
பிரத்யேக பயிற்சி மையங்களிலிருந்து டைனமிக் Inference சக்திக்கு மாறுதல்: தொழில்துறையின் கவனம், மாதிரி முன்-பயிற்சியின் கணக்கீட்டு ரீதியாக தீவிரமான பணிக்கு பிரத்தியேகமாக அர்ப்பணிக்கப்பட்ட, எப்போதும் பெரிய, ஒற்றைக்கல் GPU கிளஸ்டர்களை உருவாக்குவதிலிருந்து படிப்படியாக மாறக்கூடும். அதற்கு பதிலாக, AI நிறுவனங்கள் தங்கள் inference திறன்களை வலுப்படுத்துவதில் மூலோபாய ரீதியாக முதலீட்டை மறு ஒதுக்கீடு செய்யலாம். இது ஒட்டுமொத்தமாக குறைவான GPUs என்று அர்த்தமல்ல, மாறாக அவற்றின் வரிசைப்படுத்தல் மற்றும் நிர்வாகத்திற்கான வேறுபட்ட அணுகுமுறை. TTC-யின் வளர்ந்து வரும் கோரிக்கைகளை ஆதரிக்க, டைனமிக், பெரும்பாலும் கணிக்க முடியாத பணிச்சுமைகளைக் கையாளக்கூடிய வலுவான inference உள்கட்டமைப்பு தேவைப்படுகிறது. inference-க்கு சந்தேகத்திற்கு இடமின்றி அதிக எண்ணிக்கையிலான GPUs தேவைப்படும் என்றாலும், இந்த பணிகளின் அடிப்படை தன்மை பயிற்சியிலிருந்து கணிசமாக வேறுபடுகிறது. பயிற்சி பெரும்பாலும் நீண்ட காலத்திற்கு இயக்கப்படும் பெரிய, கணிக்கக்கூடிய தொகுதி செயலாக்க வேலைகளை உள்ளடக்கியது. Inference, குறிப்பாக TTC-யால் மேம்படுத்தப்பட்டது, நிகழ்நேர பயனர் தொடர்புகளின் அடிப்படையில் ஏற்ற இறக்கமான தேவை வடிவங்களால் வகைப்படுத்தப்படும், இது மிகவும் ‘spikey’ மற்றும் தாமத-உணர்திறன் (latency-sensitive) கொண்டது. இந்த உள்ளார்ந்த கணிக்க முடியாத தன்மை, திறன் திட்டமிடல் மற்றும் வள மேலாண்மையில் புதிய சிக்கல்களை அறிமுகப்படுத்துகிறது, இது பாரம்பரிய தொகுதி சார்ந்த பயிற்சி அமைப்புகளை விட அதிக சுறுசுறுப்பான மற்றும் அளவிடக்கூடிய தீர்வுகளைக் கோருகிறது.
சிறப்பு Inference Accelerators-ன் எழுச்சி: செயல்திறன் இடையூறு inference-ஐ நோக்கி அதிகளவில் நகரும்போது, இந்த பணிக்காக குறிப்பாக உகந்ததாக இருக்கும் வன்பொருளுக்கான தேவை அதிகரிக்கும் என்று நாங்கள் எதிர்பார்க்கிறோம். inference கட்டத்தின் போது குறைந்த தாமதம், உயர் செயல்திறன் கணக்கீட்டிற்கு முக்கியத்துவம் கொடுப்பது, பொது நோக்கத்திற்கான GPU-க்கு அப்பாற்பட்ட மாற்று கட்டமைப்புகளுக்கு வளமான நிலத்தை உருவாக்குகிறது. inference பணிச்சுமைகளுக்காக உன்னிப்பாக வடிவமைக்கப்பட்ட Application-Specific Integrated Circuits (ASICs)-ன் தத்தெடுப்பில் குறிப்பிடத்தக்க அதிகரிப்பைக் காணலாம், மற்ற புதிய accelerator வகைகளுடன். இந்த சிறப்பு சில்லுகள் பெரும்பாலும் பல்துறை GPUs-ஐ விட குறிப்பிட்ட inference செயல்பாடுகளுக்கு சிறந்த செயல்திறன்-per-watt அல்லது குறைந்த தாமதத்தை உறுதியளிக்கின்றன. inference நேரத்தில் (TTC) சிக்கலான பகுத்தறியும் பணிகளை திறமையாக செயல்படுத்தும் திறன், மூல பயிற்சி திறனை விட ஒரு முக்கியமான போட்டி வேறுபாடாக மாறினால், பயிற்சி மற்றும் inference இரண்டிலும் அவற்றின் நெகிழ்வுத்தன்மைக்காக மதிக்கப்படும் பொது நோக்க GPUs-ன் தற்போதைய ஆதிக்கம் அரிப்பை எதிர்கொள்ளக்கூடும். இந்த வளர்ந்து வரும் நிலப்பரப்பு, சிறப்பு inference சிலிக்கானை உருவாக்கி உற்பத்தி செய்யும் நிறுவனங்களுக்கு கணிசமாக பயனளிக்கக்கூடும், இது கணிசமான சந்தைப் பங்கை வெட்டக்கூடும்.
கிளவுட் தளங்கள்: தரம் மற்றும் செயல்திறனுக்கான புதிய போர்க்களம்
ஹைப்பர்ஸ்கேல் கிளவுட் வழங்குநர்கள் (AWS, Azure, மற்றும் GCP போன்றவை) மற்றும் பிற கிளவுட் கணக்கீட்டு சேவைகள் இந்த மாற்றத்தின் மையத்தில் நிற்கின்றன. TTC நோக்கிய மாற்றம் மற்றும் சக்திவாய்ந்த பகுத்தறியும் மாதிரிகளின் பெருக்கம் ஆகியவை கிளவுட் சந்தையில் வாடிக்கையாளர் எதிர்பார்ப்புகளையும் போட்டி இயக்கவியலையும் மறுவடிவமைக்க வாய்ப்புள்ளது:
சேவையின் தரம் (QoS) ஒரு வரையறுக்கும் போட்டி விளிம்பாக: துல்லியம் மற்றும் நம்பகத்தன்மை பற்றிய உள்ளார்ந்த கவலைகளுக்கு அப்பால், அதிநவீன AI மாதிரிகளின் பரந்த நிறுவன தத்தெடுப்பைத் தடுக்கும் ஒரு தொடர்ச்சியான சவால், inference APIs-ன் பெரும்பாலும் கணிக்க முடியாத செயல்திறனில் உள்ளது. இந்த APIs-ஐ நம்பியிருக்கும் வணிகங்கள் அடிக்கடி மிகவும் மாறுபட்ட மறுமொழி நேரங்கள் (latency), எதிர்பாராத விகித வரம்பு அவர்களின் பயன்பாட்டைக் கட்டுப்படுத்துதல், ஒரே நேரத்தில் பயனர் கோரிக்கைகளை திறமையாக நிர்வகிப்பதில் உள்ள சிரமங்கள் மற்றும் மாதிரி வழங்குநர்களால் அடிக்கடி API இறுதிப்புள்ளி மாற்றங்களுக்கு ஏற்ப மாற்றுவதற்கான செயல்பாட்டு மேல்நிலை போன்ற ஏமாற்றமளிக்கும் சிக்கல்களை எதிர்கொள்கின்றன. அதிநவீன TTC நுட்பங்களுடன் தொடர்புடைய அதிகரித்த கணக்கீட்டு கோரிக்கைகள் இந்த ஏற்கனவே இருக்கும் வலி புள்ளிகளை அதிகரிக்க அச்சுறுத்துகின்றன. இந்த சூழலில், சக்திவாய்ந்த மாதிரிகளுக்கான அணுகலை மட்டுமல்லாமல், வலுவான சேவையின் தரம் (QoS) உத்தரவாதங்களையும் வழங்கக்கூடிய ஒரு கிளவுட் தளம் - நிலையான குறைந்த தாமதம், கணிக்கக்கூடிய செயல்திறன், நம்பகமான இயக்க நேரம் மற்றும் தடையற்ற அளவிடுதல் ஆகியவற்றை உறுதி செய்வது - ஒரு கட்டாய போட்டி நன்மையைக் கொண்டிருக்கும். பணி-முக்கியமான AI பயன்பாடுகளைப் பயன்படுத்த விரும்பும் நிறுவனங்கள், கோரும் நிஜ உலக நிலைமைகளின் கீழ் நம்பகமான செயல்திறனை வழங்கக்கூடிய வழங்குநர்களை நோக்கி ஈர்க்கப்படும்.
செயல்திறன் முரண்பாடு: அதிகரித்த கிளவுட் நுகர்வை இயக்குகிறதா? இது எதிர் உள்ளுணர்வு போல் தோன்றலாம், ஆனால் பெரிய மொழி மாதிரிகளை (LLMs) பயிற்சி செய்வதற்கும், முக்கியமாக, inference செய்வதற்கும் அதிக கணக்கீட்டு திறன் கொண்ட முறைகளின் வருகை, AI வன்பொருள் மற்றும் கிளவுட் வளங்களுக்கான ஒட்டுமொத்த தேவையைக் குறைக்க வழிவகுக்காது. அதற்கு பதிலாக, Jevons Paradox-க்கு ஒப்பான ஒரு நிகழ்வை நாம் காணலாம். வரலாற்று ரீதியாகக் கவனிக்கப்பட்ட இந்த பொருளாதாரக் கொள்கை, வள செயல்திறனில் ஏற்படும் அதிகரிப்புகள் பெரும்பாலும் அதிக ஒட்டுமொத்த நுகர்வு விகிதத்திற்கு வழிவகுக்கும் என்று கூறுகிறது, ஏனெனில் குறைந்த செலவு அல்லது அதிக பயன்பாட்டு எளிமை பரந்த தத்தெடுப்பு மற்றும் புதிய பயன்பாடுகளை ஊக்குவிக்கிறது. AI-யின் சூழலில், DeepSeek போன்ற ஆய்வகங்களால் முன்னோடியாக உருவாக்கப்பட்ட TTC திருப்புமுனைகளால் சாத்தியமான, மிகவும் திறமையான inference மாதிரிகள், ஒரு வினவலுக்கு அல்லது ஒரு பணிக்கு ஆகும் செலவை வியத்தகு முறையில் குறைக்கக்கூடும். இந்த மலிவு விலை, பரந்த அளவிலான டெவலப்பர்கள் மற்றும் நிறுவனங்களை தங்கள் தயாரிப்புகள் மற்றும் பணிப்பாய்வுகளில் அதிநவீன பகுத்தறியும் திறன்களை ஒருங்கிணைக்க ஊக்குவிக்கும். நிகர விளைவு, கிளவுட் அடிப்படையிலான AI கணக்கீட்டிற்கான மொத்த தேவையில் கணிசமான அதிகரிப்பாக இருக்கலாம், இது இந்த திறமையான inference மாதிரிகளை அளவில் செயல்படுத்துவதையும், குறிப்பிட்ட பணிகள் அல்லது களங்களுக்கு ஏற்றவாறு சிறிய, அதிக சிறப்பு வாய்ந்த மாதிரிகளைப் பயிற்றுவிப்பதற்கான தொடர்ச்சியான தேவையையும் உள்ளடக்கியது. எனவே, சமீபத்திய முன்னேற்றங்கள், ஒட்டுமொத்த கிளவுட் AI செலவினங்களைக் குறைப்பதற்குப் பதிலாக முரண்பாடாக அதிகரிக்கக்கூடும்.
அடிப்படை மாதிரிகள்: ஒரு மாறும் அகழி
அடிப்படை மாதிரி வழங்குநர்களுக்கான போட்டி அரங்கம் - தற்போது OpenAI, Anthropic, Cohere, Google, மற்றும் Meta போன்ற பெயர்களால் ஆதிக்கம் செலுத்தப்படும் ஒரு இடம், இப்போது DeepSeek மற்றும் Mistral போன்ற வளர்ந்து வரும் வீரர்களால் இணைக்கப்பட்டுள்ளது - இதுவும் குறிப்பிடத்தக்க மாற்றத்திற்கு தயாராக உள்ளது:
- முன்-பயிற்சியின் பாதுகாப்புத் தன்மையை மறுபரிசீலனை செய்தல்: முன்னணி AI ஆய்வகங்களால் அனுபவிக்கப்பட்ட பாரம்பரிய போட்டி நன்மை, அல்லது ‘அகழி’, பரந்த தரவுத்தொகுப்புகளைத் திரட்டுவதற்கும், எப்போதும் பெரிய மாதிரிகளை முன்-பயிற்சி செய்வதற்கு மகத்தான கணக்கீட்டு வளங்களைப் பயன்படுத்துவதற்கும் அவர்களின் திறனை பெரிதும் நம்பியுள்ளது. இருப்பினும், DeepSeek போன்ற சீர்குலைக்கும் வீரர்கள் கணிசமாக குறைந்த செலவில் ஒப்பிடக்கூடிய அல்லது எல்லை நிலை செயல்திறனை நிரூபிக்க முடிந்தால், தனியுரிம முன்-பயிற்சி பெற்ற மாதிரிகளின் மூலோபாய மதிப்பு ஒரு தனித்துவமான வேறுபாடாகக் குறையக்கூடும். மாதிரி கட்டமைப்பு, பயிற்சி முறைகள், அல்லது, முக்கியமாக, test-time compute optimization ஆகியவற்றில் புதுமையான நுட்பங்கள் மற்றவர்களை இதேபோன்ற செயல்திறன் நிலைகளை மிகவும் திறமையாக அடைய அனுமதித்தால், பெரிய மாதிரிகளைப் பயிற்றுவிக்கும் திறன் ஒரு தனித்துவமான நன்மையாகக் குறையக்கூடும். TTC மூலம் டிரான்ஸ்பார்மர் மாதிரி திறன்களை மேம்படுத்துவதில் தொடர்ச்சியான விரைவான கண்டுபிடிப்புகளை நாம் எதிர்பார்க்க வேண்டும், மேலும் DeepSeek-ன் தோற்றம் விளக்குவது போல், இந்த திருப்புமுனைகள் நிறுவப்பட்ட தொழில் ஜாம்பவான்களின் வட்டத்திற்கு அப்பால் இருந்து உருவாகலாம். இது அதிநவீன AI வளர்ச்சியின் சாத்தியமான ஜனநாயகமயமாக்கலை பரிந்துரைக்கிறது, இது மிகவும் மாறுபட்ட மற்றும் போட்டித்தன்மை வாய்ந்த சூழலியல் அமைப்பை வளர்க்கிறது.
நிறுவன AI தத்தெடுப்பு மற்றும் பயன்பாட்டு அடுக்கு
இந்த மாற்றங்களின் தாக்கங்கள் நிறுவன மென்பொருள் நிலப்பரப்பு மற்றும் வணிகங்களுக்குள் AI-யின் பரந்த தத்தெடுப்பு வரை பரவுகின்றன, குறிப்பாக Software-as-a-Service (SaaS) பயன்பாட்டு அடுக்கைப் பொறுத்தவரை:
பாதுகாப்பு மற்றும் தனியுரிமை தடைகளை வழிநடத்துதல்: DeepSeek போன்ற புதிய நுழைபவர்களின் புவிசார் அரசியல் தோற்றம் தவிர்க்க முடியாமல் சிக்கல்களை அறிமுகப்படுத்துகிறது, குறிப்பாக தரவு பாதுகாப்பு மற்றும் தனியுரிமை குறித்து. DeepSeek-ன் சீனத் தளத்தைக் கருத்தில் கொண்டு, அதன் சலுகைகள், குறிப்பாக அதன் நேரடி API சேவைகள் மற்றும் chatbot பயன்பாடுகள், வட அமெரிக்கா, ஐரோப்பா மற்றும் பிற மேற்கத்திய நாடுகளில் உள்ள சாத்தியமான நிறுவன வாடிக்கையாளர்களிடமிருந்து தீவிர ஆய்வுக்கு உட்படுத்தப்பட வாய்ப்புள்ளது. பல நிறுவனங்கள் முன்னெச்சரிக்கை நடவடிக்கையாக DeepSeek-ன் சேவைகளுக்கான அணுகலை முன்கூட்டியே தடுப்பதாக அறிக்கைகள் ஏற்கனவே குறிப்பிடுகின்றன. DeepSeek-ன் மாதிரிகள் மேற்கத்திய தரவு மையங்களுக்குள் மூன்றாம் தரப்பு கிளவுட் வழங்குநர்களால் ஹோஸ்ட் செய்யப்படும்போது கூட, தரவு ஆளுமை, சாத்தியமான அரசு செல்வாக்கு மற்றும் கடுமையான தனியுரிமை விதிமுறைகளுக்கு (GDPR அல்லது CCPA போன்றவை) இணங்குதல் பற்றிய நீடித்த கவலைகள் பரவலான நிறுவன தத்தெடுப்பைத் தடுக்கக்கூடும். மேலும், ஆராய்ச்சியாளர்கள் jailbreaking (பாதுகாப்புக் கட்டுப்பாடுகளைத் தவிர்ப்பது), மாதிரி வெளியீடுகளில் உள்ளார்ந்த சார்புகள் மற்றும் தீங்கு விளைவிக்கும் அல்லது பொருத்தமற்ற உள்ளடக்கத்தை உருவாக்குதல் தொடர்பான சாத்தியமான பாதிப்புகளை தீவிரமாக ஆராய்ந்து முன்னிலைப்படுத்துகின்றனர். மாதிரிகளின் தொழில்நுட்ப திறன்கள் காரணமாக நிறுவன R&D குழுக்களுக்குள் பரிசோதனை மற்றும் மதிப்பீடு ஏற்படக்கூடும் என்றாலும், இந்த குறிப்பிடத்தக்க நம்பிக்கை மற்றும் பாதுகாப்பு பரிசீலனைகளைக் கருத்தில் கொண்டு, DeepSeek-ன் தற்போதைய சலுகைகளின் அடிப்படையில் மட்டும் பெருநிறுவன வாங்குபவர்கள் OpenAI அல்லது Anthropic போன்ற நிறுவப்பட்ட, நம்பகமான வழங்குநர்களை விரைவாக கைவிடுவார்கள் என்பது சாத்தியமில்லை.
செங்குத்து நிபுணத்துவம் உறுதியான தளத்தைக் காண்கிறது: வரலாற்று ரீதியாக, குறிப்பிட்ட தொழில்கள் அல்லது வணிக செயல்பாடுகளுக்கு (செங்குத்து பயன்பாடுகள்) AI-இயங்கும் பயன்பாடுகளை உருவாக்கும் டெவலப்பர்கள், ஏற்கனவே உள்ள பொது-நோக்க அடிப்படை மாதிரிகளைச் சுற்றி அதிநவீன பணிப்பாய்வுகளை உருவாக்குவதில் முதன்மையாக கவனம் செலுத்தியுள்ளனர். கள-குறிப்பிட்ட அறிவை உட்செலுத்துவதற்கு Retrieval-Augmented Generation (RAG) போன்ற நுட்பங்கள், ஒரு குறிப்பிட்ட பணிக்கு சிறந்த LLM-ஐத் தேர்ந்தெடுக்க அறிவார்ந்த மாதிரி ரூட்டிங், வெளிப்புற கருவிகளை ஒருங்கிணைக்க செயல்பாடு அழைப்பு, மற்றும் பாதுகாப்பான மற்றும் தொடர்புடைய வெளியீடுகளை உறுதிப்படுத்த வலுவான பாதுகாப்பு வழிகாட்டுதல்களை செயல்படுத்துதல் ஆகியவை இந்த சக்திவாய்ந்த ஆனால் பொதுவான மாதிரிகளை சிறப்புத் தேவைகளுக்கு ஏற்ப மாற்றுவதில் மையமாக இருந்தன. இந்த அணுகுமுறைகள் கணிசமான வெற்றியை அளித்துள்ளன. இருப்பினும், ஒரு தொடர்ச்சியான பதட்டம் பயன்பாட்டு அடுக்கை நிழலாடியுள்ளது: அடிப்படை அடிப்படை மாதிரிகளின் திறன்களில் திடீர், வியத்தகு பாய்ச்சல், இந்த கவனமாக வடிவமைக்கப்பட்ட பயன்பாடு-குறிப்பிட்ட கண்டுபிடிப்புகளை உடனடியாக வழக்கற்றுப் போகச் செய்யக்கூடும் என்ற பயம் - OpenAI-யின் Sam Altman-ஆல் பிரபலமாக ‘steamrolling’ என்று பெயரிடப்பட்ட ஒரு சூழ்நிலை.
ஆயினும்கூட, AI முன்னேற்றத்தின் பாதை உண்மையில் மாறினால், முன்-பயிற்சியில் அதிவேக மேம்பாடுகளை விட test-time compute-ஐ மேம்படுத்துவதிலிருந்து மிகவும் குறிப்பிடத்தக்க ஆதாயங்கள் இப்போது எதிர்பார்க்கப்படுகின்றன என்றால், பயன்பாட்டு அடுக்கு மதிப்புக்கான இருத்தலியல் அச்சுறுத்தல் குறைகிறது. முன்னேற்றங்கள் TTC optimization-களிலிருந்து அதிகளவில் பெறப்படும் ஒரு நிலப்பரப்பில், குறிப்பிட்ட களங்களில் நிபுணத்துவம் பெற்ற நிறுவனங்களுக்கு புதிய வழிகள் திறக்கப்படுகின்றன. கள-குறிப்பிட்ட பிந்தைய பயிற்சி வழிமுறைகளில் கவனம் செலுத்தும் கண்டுபிடிப்புகள் - ஒரு குறிப்பிட்ட தொழில்துறையின் வாசகங்களுக்கு உகந்ததாக கட்டமைக்கப்பட்ட தூண்டுதல் நுட்பங்களை உருவாக்குதல், நிகழ்நேர பயன்பாடுகளுக்கான தாமத-விழிப்புணர்வு பகுத்தறியும் உத்திகளை உருவாக்குதல், அல்லது குறிப்பிட்ட வகை தரவுகளுக்கு ஏற்றவாறு மிகவும் திறமையான மாதிரி முறைகளை வடிவமைத்தல் போன்றவை - இலக்கு வைக்கப்பட்ட செங்குத்து சந்தைகளுக்குள் கணிசமான செயல்திறன் நன்மைகளைத் தரக்கூடும்.
கள-குறிப்பிட்ட தேர்வுமுறைக்கான இந்த சாத்தியம், OpenAI-யின் GPT-4o அல்லது DeepSeek-ன் R-series போன்ற பகுத்தறிவு-கவனம் செலுத்தும் மாதிரிகளின் புதிய தலைமுறைக்கு குறிப்பாக பொருத்தமானது, அவை சக்திவாய்ந்தவை என்றாலும், பெரும்பாலும் குறிப்பிடத்தக்க தாமதத்தைக் காட்டுகின்றன, சில சமயங்களில் ஒரு பதிலை உருவாக்க பல வினாடிகள் ஆகும். நிகழ்நேர தொடர்பு தேவைப்படும் பயன்பாடுகளில் (எ.கா., வாடிக்கையாளர் சேவை போட்கள், ஊடாடும் தரவு பகுப்பாய்வு கருவிகள்), இந்த தாமதத்தைக் குறைப்பதும், ஒரே நேரத்தில் ஒரு குறிப்பிட்ட கள சூழலில் inference வெளியீட்டின் தரம் மற்றும் பொருத்தத்தை மேம்படுத்துவதும் ஒரு குறிப்பிடத்தக்க போட்டி வேறுபாட்டைக் குறிக்கிறது. இதன் விளைவாக, ஆழ்ந்த செங்குத்து நிபுணத்துவம் கொண்ட பயன்பாட்டு அடுக்கு நிறுவனங்கள், பணிப்பாய்வுகளை உருவாக்குவதில் மட்டுமல்லாமல், inference செயல்திறனை தீவிரமாக மேம்படுத்துவதிலும், அவர்களின் குறிப்பிட்ட இடத்திற்கு மாதிரி நடத்தையை நன்றாகச் சரிசெய்வதிலும் பெருகிய முறையில் முக்கிய பங்கு வகிக்கக்கூடும். மூல AI சக்தியை உறுதியான வணிக மதிப்பாக மாற்றுவதில் அவர்கள் இன்றியமையாத பங்காளிகளாக மாறுகிறார்கள்.
DeepSeek-ன் தோற்றம் ஒரு பரந்த போக்கின் சக்திவாய்ந்த விளக்கமாக செயல்படுகிறது: உயர்ந்த மாதிரி தரத்திற்கான பிரத்யேக பாதையாக முன்-பயிற்சியில் முழுமையான அளவை நம்பியிருப்பது குறைந்து வருகிறது. அதற்கு பதிலாக, அதன் வெற்றி inference கட்டத்தின் போது கணக்கீட்டை மேம்படுத்துவதன் - test-time compute-ன் சகாப்தம் - அதிகரித்து வரும் முக்கியத்துவத்தை அடிக்கோடிட்டுக் காட்டுகிறது. மேற்கத்திய நிறுவன மென்பொருளுக்குள் DeepSeek-ன் குறிப்பிட்ட மாதிரிகளின் நேரடி பயன்பாடு தற்போதைய பாதுகாப்பு மற்றும் புவிசார் அரசியல் ஆய்வுகளால் கட்டுப்படுத்தப்படலாம் என்றாலும், அவற்றின் மறைமுக செல்வாக்கு ஏற்கனவே தெளிவாகத் தெரிகிறது. அவர்கள் நிரூபித்த நுட்பங்கள் மற்றும் சாத்தியக்கூறுகள் சந்தேகத்திற்கு இடமின்றி நிறுவப்பட்ட AI ஆய்வகங்களுக்குள் ஆராய்ச்சி மற்றும் பொறியியல் முயற்சிகளைத் தூண்டுகின்றன, அளவு மற்றும் வளங்களில் தங்களின் தற்போதைய நன்மைகளை நிறைவு செய்ய இதேபோன்ற TTC optimization உத்திகளை ஒருங்கிணைக்க அவர்களை கட்டாயப்படுத்துகின்றன. இந்த போட்டி அழுத்தம், எதிர்பார்த்தபடி, அதிநவீன மாதிரி inference-ன் பயனுள்ள செலவைக் குறைக்கத் தயாராக இருப்பதாகத் தெரிகிறது, இது Jevons Paradox-க்கு ஏற்ப, டிஜிட்டல் பொருளாதாரம் முழுவதும் மேம்பட்ட AI திறன்களின் பரந்த பரிசோதனை மற்றும் ஒட்டுமொத்த பயன்பாட்டின் அதிகரிப்புக்கு பங்களிக்க வாய்ப்புள்ளது.