Nvidia நிறுவனம் ஏஜென்ட் அடிப்படையிலான செயற்கை நுண்ணறிவு அலைக்காக தன்னை தயார்படுத்தி வருகிறது. இந்த செயற்கை நுண்ணறிவு, அனுமான திறன்களுக்கு முன்னெப்போதும் இல்லாத தேவைகளை உருவாக்கும் என்று எதிர்பார்க்கப்படுகிறது. இந்த சவாலைச் சமாளிக்க, Nvidia வன்பொருள் மற்றும் மென்பொருள் கண்டுபிடிப்புகளை உள்ளடக்கிய ஒரு விரிவான உத்தியை அறிமுகப்படுத்தியுள்ளது.
வன்பொருள் உத்தி: விரிவாக்கம் மற்றும் பரவலாக்கம்
Nvidia வின் வன்பொருள் உத்தியின் மையமாக எப்போதும் சக்திவாய்ந்த GPUகளை உருவாக்குவது உள்ளது. நிறுவனம் ஒரு இரட்டை முனை அணுகுமுறையை ஏற்றுள்ளது, முதலில் செங்குத்து விரிவாக்கம் மற்றும் பின்னர் கிடைமட்ட விரிவாக்கம். ஒரே ஒரு, அதி-சக்திவாய்ந்த AI சூப்பர் கம்ப்யூட்டரை உருவாக்குவது மட்டுமல்லாமல், ஒன்றோடொன்று இணைக்கப்பட்ட ரேக்குகளின் முழு சுற்றுச்சூழல் அமைப்பையும் உருவாக்குவதே இதன் நோக்கமாகும். இந்த ‘AI தொழிற்சாலை’ அணுகுமுறை, மிகவும் தேவைப்படும் AI பணிகளுக்கு தேவையான கணக்கீட்டு சக்தியை வழங்குவதற்காக வடிவமைக்கப்பட்டுள்ளது.
சமீபத்தில் நடந்த GTC மாநாட்டில் வெளியிடப்பட்ட புதிய Blackwell Ultra ரேக் பொருத்தப்பட்ட AI சூப்பர் கம்ப்யூட்டர், இந்த உத்திக்கு ஒரு எடுத்துக்காட்டு. பயிற்சி மற்றும் சோதனை நேர அளவிடுதல் ஊகம் ஆகிய இரண்டையும் துரிதப்படுத்த வடிவமைக்கப்பட்ட Blackwell Ultra, ஏற்கனவே உள்ள Blackwell கட்டமைப்பைப் பயன்படுத்துகிறது, ஆனால் சக்திவாய்ந்த GB300 NVL72 ஐ உள்ளடக்கியது. இந்த கட்டமைப்பு NVLink வழியாக ஒன்றோடொன்று இணைக்கப்பட்ட 72 Blackwell Ultra GPUகளைக் கொண்டுள்ளது, இது FP4 துல்லிய கணக்கீட்டு சக்தியில் 1.1 Exaflops ஐ வழங்குகிறது. GB300 NVL72 GB200 NVL72 ஐ விட 1.5 மடங்கு AI செயல்திறனைக் கொண்டுள்ளது. ஒரு DGS GB300 அமைப்பு 15 Exaflops கணக்கீட்டை வழங்குகிறது. 2025 ஆம் ஆண்டின் இரண்டாம் பாதியில் வெளியிட திட்டமிடப்பட்டுள்ள Blackwell Ultra, Cisco, Dell, HPE, Lenovo, ASUS, Foxconn, Gigabyte, Pegatron மற்றும் Quanta உள்ளிட்ட பல்வேறு சர்வர் உபகரண விற்பனையாளர்களால் ஆதரிக்கப்படும். கூடுதலாக, AWS, GCP மற்றும் Azure போன்ற கிளவுட் சேவை வழங்குநர்கள் Blackwell Ultra அடிப்படையிலான கணக்கீட்டு சேவைகளை வழங்குவார்கள்.
இந்த பவர் பிளாண்ட் அளவிலான AI தொழிற்சாலை அமைப்புகளுக்கு அப்பால், Nvidia நிறுவனங்கள் மத்தியில் அனுமான தேவைகளை இலக்காகக் கொண்டு ஒரு புதிய கணினி வரிசையை அறிமுகப்படுத்தியுள்ளது. இதில் DGX Spark மற்றும் DGX Station தனிப்பட்ட AI கணினிகள் அடங்கும். DGX Spark, ஒரு Mac mini ஐ ஒத்த அளவுடன், 1 PFlops வரை கணக்கீட்டு சக்தியை வழங்குகிறது.
இதை ஒரு கண்ணோட்டத்தில் பார்த்தால், தைவான் அரசாங்கம் 2021 இல் 50,000 க்கும் மேற்பட்ட கோர்களுடன் (cores) அறிமுகப்படுத்தப்பட்ட Taiwania 3 சூப்பர் கம்ப்யூட்டர், 2.7 PFlops செயல்திறனை மட்டுமே வழங்குகிறது. வெறும் நான்கு ஆண்டுகளில், மூன்று டெஸ்க்டாப் அளவிலான தனிப்பட்ட AI கணினிகளின் கணக்கீட்டு சக்தி Taiwania 3 ஐ விட அதிகமாக உள்ளது. 128GB நினைவக கட்டமைப்புக்கு $3,999 (தோராயமாக NT$130,000) விலையுள்ள இந்த புதிய தனிப்பட்ட AI கணினிகள், நிறுவனங்களுக்குள் எதிர்கால உள் AI தேவைகளுக்கு சக்தியளிக்க வடிவமைக்கப்பட்டுள்ளன, மேலும் மினி-AI தொழிற்சாலைகளாக அல்லது விளிம்பு AI சூழல்களில் கூட இயங்குகின்றன.
எதிர்கால சாலை வரைபடம்: வேரா ரூபின் மற்றும் அதற்கு அப்பால்
எதிர்காலத்தில், Nvidia வின் CEO ஜென்சன் ஹுவாங் அடுத்த இரண்டு ஆண்டுகளுக்கான தயாரிப்பு சாலை வரைபடத்தை கோடிட்டுக் காட்டியுள்ளார். 2026 ஆம் ஆண்டின் இரண்டாம் பாதியில், டார்க் மேட்டரைக் கண்டுபிடித்த அமெரிக்க வானியலாளர் வேரா ரூபின் நினைவாக பெயரிடப்பட்ட Vera Rubin NVL144 ஐ வெளியிட நிறுவனம் திட்டமிட்டுள்ளது. Vera Rubin NVL144 GB300 NVL72 ஐ விட 3.3 மடங்கு செயல்திறனை வழங்கும், நினைவக திறன், அலைவரிசை மற்றும் NVLink வேகம் 1.6 மடங்கு அதிகரிக்கும். 2027 ஆம் ஆண்டின் இரண்டாம் பாதியில், Nvidia Rubin Ultra NVL576 ஐ அறிமுகப்படுத்தும், இது GB300 NVL72 ஐ விட 14 மடங்கு செயல்திறனை வழங்கும், மேலும் NVLink7 மற்றும் CX9 வழியாக கணிசமாக மேம்படுத்தப்பட்ட நினைவக திறன் மற்றும் அலைவரிசை வேகத்தையும் கொண்டிருக்கும்.
வேரா ரூபின் கட்டமைப்பைத் தொடர்ந்து, Nvidia வின் அடுத்த தலைமுறை கட்டமைப்பு அமெரிக்க இயற்பியலாளர் ரிச்சர்ட் ஃபெய்ன்மேன் பெயரிடப்பட்டது. அவர் சேலஞ்சர் விண்வெளி ஓடம் பேரழிவு விசாரணையில் பணியாற்றியதற்காக அறியப்படுகிறார்.
மென்பொருள் உத்தி: Nvidia டைனமோ
Nvidia எப்போதும் மென்பொருளுக்கு அதிக முக்கியத்துவம் அளிக்கிறது, அதை வன்பொருளை விட முக்கியமானதாக கருதுகிறது. இந்த மூலோபாய கவனம் நிறுவனத்தின் AI தொழிற்சாலை முயற்சிகளுக்கும் பொருந்தும்.
CUDA-X AI முடுக்க நூலகத்தை பல்வேறு களங்களுக்கு விரிவுபடுத்துவதோடு, சிறப்பு முடுக்க நூலகங்களை உருவாக்குவதோடு மட்டுமல்லாமல், Nvidia ஒரு புதிய AI தொழிற்சாலை இயக்க முறைமையான Nvidia Dynamo ஐ அறிமுகப்படுத்தியுள்ளது. குறிப்பிடத்தக்க வகையில், Nvidia இந்த இயக்க முறைமையை ஓப்பன் சோர்ஸ் செய்துள்ளது.
Nvidia Dynamo என்பது LLM அனுமான சேவைகளை வழங்கும் தளங்களை உருவாக்க வடிவமைக்கப்பட்ட ஓப்பன் சோர்ஸ் அனுமான சேவை கட்டமைப்பாகும். இது K8s சூழல்களில் பயன்படுத்தப்படலாம் மற்றும் பெரிய அளவிலான AI அனுமான பணிகளைப் பயன்படுத்தவும் நிர்வகிக்கவும் பயன்படுத்தப்படுகிறது. Dynamo வை அதன் NIM மைக்ரோ சர்வீசஸ் கட்டமைப்பில் ஒருங்கிணைக்க Nvidia திட்டமிட்டுள்ளது, இது Nvidia AI Enterprise கட்டமைப்பின் ஒரு அங்கமாக ஆக்குகிறது.
Dynamo என்பது Nvidia வின் ஏற்கனவே உள்ள ஓப்பன் சோர்ஸ் அனுமான சர்வர் தளமான Triton இன் அடுத்த தலைமுறை தயாரிப்பு ஆகும். LLM அனுமான பணிகளை இரண்டு நிலைகளாக பிரிப்பதே இதன் முக்கிய அம்சமாகும், இது GPUகளின் நெகிழ்வான மற்றும் திறமையான பயன்பாட்டிற்கு அனுமான செயலாக்கத்தை மேம்படுத்தவும், செயல்திறனை மேம்படுத்தவும் மற்றும் GPU பயன்பாட்டை அதிகரிக்கவும் அனுமதிக்கிறது. டைனமோ அனுமான தேவைகளின் அடிப்படையில் GPUகளை மாறும் வகையில் ஒதுக்க முடியும் மற்றும் GPUகளுக்கு இடையே ஒத்திசைவற்ற தரவு பரிமாற்றத்தை துரிதப்படுத்த முடியும், இது மாதிரி அனுமான பதில் நேரத்தை குறைக்கிறது.
Transformer அடிப்படையிலான GAI மாதிரிகள் அனுமானத்தை இரண்டு நிலைகளாக பிரிக்கின்றன: உள்ளீட்டு தரவை சேமிப்பிற்கான டோக்கன்களாக மாற்றும் Prefill (முன்-உள்ளீடு) மற்றும் முந்தையதை அடிப்படையாகக் கொண்டு அடுத்த டோக்கனை உருவாக்கும் ஒரு தொடர்ச்சியான செயல்முறையான Decode.
பாரம்பரிய LLM அனுமானம் Prefill மற்றும் Decode பணிகளை ஒரே GPUக்கு ஒதுக்குகிறது. இருப்பினும், இந்த பணிகளின் வெவ்வேறு கணக்கீட்டு பண்புகள் காரணமாக, Dynamo அவற்றை பிரித்து, GPU ஆதாரங்களை அதற்கேற்ப ஒதுக்குகிறது மற்றும் பணியின் பண்புகளை அடிப்படையாகக் கொண்டு ஒதுக்கீட்டை மாறும் வகையில் சரிசெய்கிறது. இது GPU கிளஸ்டர் செயல்திறனை மேம்படுத்துகிறது.
Nvidia வின் சோதனை GB200 NVL72 இல் 671 பில்லியன் அளவுருக்கள் கொண்ட DeepSeek-R1 மாதிரியுடன் டைனமோவைப் பயன்படுத்துவது அனுமான செயல்திறனை 30 மடங்கு மேம்படுத்தும் என்பதைக் காட்டுகிறது. Hopper GPUகளில் இயங்கும் Llama 70B இல் செயல்திறன் இரண்டு மடங்குக்கு மேல் மேம்படுத்தப்படலாம்.
அனுமான கணக்கீட்டின் சிக்கலான தன்மை மற்றும் பல்வேறு இணையான செயலாக்க மாதிரிகள் காரணமாக அனுமான பணிகளை நிர்வகிப்பது சிக்கலானது. AI தொழிற்சாலைகளுக்கான இயக்க முறைமையை வழங்க Nvidia Dynamo கட்டமைப்பை அறிமுகப்படுத்தியுள்ளதாக ஹுவாங் வலியுறுத்தினார்.
பாரம்பரிய தரவு மையங்கள் நிறுவன IT ஆதாரங்களில் வெவ்வேறு பயன்பாடுகளை ஒருங்கிணைக்க VMware போன்ற இயக்க முறைமைகளை நம்பியுள்ளன. AI ஏஜென்ட்கள் எதிர்காலத்தின் பயன்பாடுகள், மற்றும் AI தொழிற்சாலைகளுக்கு VMware அல்ல Dynamo தேவைப்படுகிறது.
தொழில்துறை புரட்சியைத் தூண்டிய டைனமோவின் பெயரால் புதிய AI தொழிற்சாலை இயக்க முறைமைக்கு ஹுவாங் பெயரிட்டது, இந்த தளத்திற்கான அவரது எதிர்பார்ப்புகளையும் அபிலாஷைகளையும் வெளிப்படுத்துகிறது.