ஒரு வியப்பான திருத்தம்: Nvidia அதன் GPU எண்ணிக்கையை மறுபரிசீலனை செய்கிறது
செமிகண்டக்டர் கண்டுபிடிப்புகளின் உயர்-பங்கு அரங்கில், Nvidia’வின் GPU தொழில்நுட்ப மாநாடு (GTC) எதிர்காலத்தை வெளிப்படுத்துவதற்கான ஒரு முதன்மை மேடையாக செயல்படுகிறது. அதன் மிக சமீபத்திய கூட்டத்தின் போது, செயற்கை நுண்ணறிவு மற்றும் துரிதப்படுத்தப்பட்ட கணினி ஆகியவற்றில் முன்னேற்றங்களைச் சுற்றியுள்ள எதிர்பார்க்கப்பட்ட ஆரவாரங்களுக்கு மத்தியில், நிறுவனம் ஒரு நுட்பமான ஆனால் சாத்தியமான ஆழமான மாற்றத்தை அறிமுகப்படுத்தியது - அது ஒரு கிராபிக்ஸ் செயலாக்க அலகு (GPU) என்பதை அடிப்படையில் வரையறுக்கும் விதத்தில் ஒரு மாற்றம். இது வெறும் தொழில்நுட்ப அடிக்குறிப்பு அல்ல; இது குறிப்பிடத்தக்க கீழ்நிலை தாக்கங்களைக் கொண்ட ஒரு மறுசீரமைப்பு ஆகும், குறிப்பாக Nvidia’வின் மேம்பட்ட AI தீர்வுகளைப் பயன்படுத்துவதற்கான செலவுக் கட்டமைப்பைப் பொறுத்தவரை.
CEO Jensen Huang அவர்களே GTC மேடையில் இருந்து இந்த மாற்றத்தை நேரடியாக உரையாற்றினார், இது அவர்களின் அதிநவீன Blackwell கட்டமைப்பைப் பற்றிய முந்தைய மேற்பார்வையின் திருத்தம் என்று வடிவமைத்தார். ‘நான் செய்த தவறுகளில் ஒன்று: Blackwell உண்மையில் ஒரு Blackwell சிப்பில் இரண்டு GPUகள் ஆகும்,’ என்று அவர் கூறினார். தெளிவு மற்றும் நிலைத்தன்மையை மையமாகக் கொண்ட பகுத்தறிவு முன்வைக்கப்பட்டது, குறிப்பாக NVLink, Nvidia’வின் அதிவேக இடை இணைப்பு தொழில்நுட்பத்துடன் தொடர்புடைய பெயரிடும் மரபுகளைப் பொறுத்தவரை. ‘அந்த ஒரு சிப்பை நாங்கள் GPU என்று அழைத்தோம், அது தவறு. அதற்குக் காரணம் அது அனைத்து NVLink பெயரிடலையும் குழப்புகிறது,’ என்று Huang விளக்கினார். மாதிரி எண்களை எளிமைப்படுத்துவது ஒரு தர்க்கரீதியான நேர்த்தியை வழங்கினாலும், இந்த மறுவரையறை வெறும் சொற்பொருளைத் தாண்டிய எடையைக் கொண்டுள்ளது.
மாற்றத்தின் மையமானது, இயற்பியல் தொகுதிகளை (குறிப்பாக, உயர் செயல்திறன் சேவையகங்களில் பொதுவான SXM வடிவ காரணி) தனிப்பட்ட GPUகளாக எண்ணுவதிலிருந்து அந்த தொகுதிகளுக்குள் உள்ள தனித்துவமான சிலிக்கான் டைகளை (dies) எண்ணுவதற்கு நகர்கிறது. சொற்களஞ்சியத்தில் இந்த சிறியதாகத் தோன்றும் சரிசெய்தல், Nvidia’வின் AI Enterprise மென்பொருள் தொகுப்பைப் பயன்படுத்தும் நிறுவனங்களுக்கான நிதி நிலப்பரப்பை வியத்தகு முறையில் மாற்றும் திறனைக் கொண்டுள்ளது.
நிதி அலை விளைவு: AI Enterprise உரிமத்தில் இரட்டிப்பா?
Nvidia’வின் AI Enterprise என்பது AI பயன்பாடுகளின் மேம்பாடு மற்றும் வரிசைப்படுத்தலை நெறிப்படுத்த வடிவமைக்கப்பட்ட ஒரு விரிவான மென்பொருள் தளமாகும். இது பரந்த அளவிலான கருவிகள், கட்டமைப்புகள் மற்றும் முக்கியமாக, Nvidia Inference Microservices (NIMs) க்கான அணுகலை உள்ளடக்கியது, அவை AI மாதிரிகளை திறமையாக இயக்குவதற்கான உகந்த கொள்கலன்களாகும். இந்த சக்திவாய்ந்த தொகுப்பிற்கான உரிம மாதிரி வரலாற்று ரீதியாக பயன்படுத்தப்பட்ட GPUகளின் எண்ணிக்கையுடன் நேரடியாக இணைக்கப்பட்டுள்ளது. தற்போதைய விலை கட்டமைப்புகள் ஒரு GPUக்கு ஆண்டுக்கு சுமார் $4,500 அல்லது கிளவுட் அடிப்படையிலான விகிதத்தில் ஒரு GPUக்கு ஒரு மணி நேரத்திற்கு $1 என செலவை நிர்ணயிக்கின்றன.
முந்தைய தலைமுறை அல்லது சில Blackwell உள்ளமைவுகளைக் கவனியுங்கள். ஒரு Nvidia HGX B200 சேவையகம், எட்டு SXM தொகுதிகளுடன் பொருத்தப்பட்டுள்ளது, அங்கு ஒவ்வொரு தொகுதியும் அப்போது ஒரு Blackwell GPU ஆகக் கருதப்பட்டதைக் கொண்டிருந்தது, எட்டு AI Enterprise உரிமங்கள் தேவைப்படும். இது ஆண்டு மென்பொருள் சந்தா செலவை $36,000 (8 GPUs * $4,500/GPU) அல்லது ஒரு மணி நேர கிளவுட் செலவை $8 (8 GPUs * $1/GPU/hour) ஆக மாற்றியது.
இப்போது, HGX B300 NVL16 போன்ற அமைப்புகளுடன் புதிதாக வரையறுக்கப்பட்ட நிலப்பரப்பிற்குள் நுழையுங்கள். இந்த அமைப்பும் எட்டு இயற்பியல் SXM தொகுதிகளைக் கொண்டுள்ளது. இருப்பினும், திருத்தப்பட்ட வரையறையின் கீழ், Nvidia இப்போது இந்த தொகுதிகளுக்குள் உள்ள ஒவ்வொரு சிலிக்கான் டையையும் ஒரு தனிப்பட்ட GPU ஆகக் கணக்கிடுகிறது. இந்த குறிப்பிட்ட உள்ளமைவில் ஒவ்வொரு தொகுதியும் இரண்டு டைகளைக் கொண்டிருப்பதால், உரிம நோக்கங்களுக்கான மொத்த GPU எண்ணிக்கை 16 GPUகளாக (8 தொகுதிகள் * 2 டைகள்/தொகுதி) திறம்பட இரட்டிப்பாகிறது.
Nvidia அதன் தற்போதைய ஒரு GPUக்கான விலை கட்டமைப்பை AI Enterprise தொகுப்பிற்கு பராமரிக்கிறது என்று வைத்துக் கொண்டால் - நிறுவனம் இன்னும் இறுதி செய்யப்படவில்லை என்று கூறியுள்ள ஒரு புள்ளி - தாக்கங்கள் கடுமையாக உள்ளன. அதே எட்டு-தொகுதி HGX B300 அமைப்புக்கு இப்போது 16 உரிமங்கள் தேவைப்படலாம், இது ஆண்டு மென்பொருள் செலவை $72,000 (16 GPUs * $4,500/GPU) அல்லது கிளவுட்டில் ஒரு மணி நேரத்திற்கு $16 ஆக உயர்த்தும். இது ‘GPU’ எவ்வாறு கணக்கிடப்படுகிறது என்பதற்கான மாற்றத்திலிருந்து நேரடியாக எழும், ஒப்பிடக்கூடிய வன்பொருள் அடர்த்திக்கு மென்பொருள் சந்தா செலவில் 100% அதிகரிப்பைக் குறிக்கிறது.
இரண்டு கட்டமைப்புகளின் கதை: கடந்த கால அறிக்கைகளை சமரசம் செய்தல்
பெயரிடலில் இந்த மாற்றம் Nvidia’வின் Blackwell கட்டமைப்பின் முந்தைய குணாதிசயங்களுடன் ஒரு சுவாரஸ்யமான வேறுபாட்டைக் காட்டுகிறது. Blackwell ஆரம்பத்தில் வெளியிடப்பட்டபோது, அதன் வடிவமைப்பு குறித்து விவாதங்கள் எழுந்தன, இது ஒரு செயலி தொகுப்புக்குள் ஒன்றாக இணைக்கப்பட்ட பல சிலிக்கான் துண்டுகளை (டைகள்) உள்ளடக்கியது. அந்த நேரத்தில், Nvidia Blackwell ஐ ‘சிப்லெட்’ (chiplet) கட்டமைப்பு என்ற சொல்லைப் பயன்படுத்தி விவரிப்பதை தீவிரமாக எதிர்த்தது - இது பல சிறிய, ஒன்றோடொன்று இணைக்கப்பட்ட டைகளைப் பயன்படுத்தும் வடிவமைப்புகளுக்கான பொதுவான தொழில் சொல். அதற்கு பதிலாக, நிறுவனம் வேறுபட்ட கண்ணோட்டத்தை வலியுறுத்தியது.
Blackwell வெளியீட்டு கவரேஜின் போது அறிவிக்கப்பட்டபடி, Nvidia அது ‘ஒரு ஒருங்கிணைந்த, ஒற்றை GPU ஆக செயல்படும் இரண்டு-ரெட்டிகல் வரையறுக்கப்பட்ட டை கட்டமைப்பைப்’ பயன்படுத்துவதாக வாதிட்டது. இந்த சொற்றொடர், இரண்டு டைகளின் இயற்பியல் இருப்பு இருந்தபோதிலும், அவை ஒரு தர்க்கரீதியான செயலாக்க அலகாக ஒத்திசைந்து செயல்பட்டன என்பதை வலுவாக பரிந்துரைத்தது. B300 உள்ளமைவுக்குப் பயன்படுத்தப்படும் புதிய எண்ணும் முறை, குறைந்தபட்சம் மென்பொருள் உரிமக் கண்ணோட்டத்தில், இந்த ‘ஒருங்கிணைந்த, ஒற்றை GPU’ கருத்திலிருந்து விலகிச் செல்வதாகத் தெரிகிறது, டைகளை தனித்துவமான நிறுவனங்களாகக் கருதுகிறது. ஆரம்ப விளக்கம் முதன்மையாக வன்பொருளின் செயல்பாட்டுத் திறனில் கவனம் செலுத்தியதா அல்லது உரிமம் குறித்த மூலோபாயக் கண்ணோட்டம் உருவாகியுள்ளதா என்பது குறித்த கேள்விகளை இது எழுப்புகிறது.
செயல்திறன் ஆதாயங்கள் vs. சாத்தியமான செலவு உயர்வுகள்: B300 முன்மொழிவை மதிப்பிடுதல்
HGX B300 க்கான மென்பொருள் உரிமக் கட்டணங்கள் B200 போன்ற அதன் முன்னோடிகளுடன் ஒப்பிடும்போது இரட்டிப்பாகும் சாத்தியக்கூறுகளைக் கருத்தில் கொள்ளும்போது, புதிய வன்பொருளால் வழங்கப்படும் செயல்திறன் மேம்பாடுகளை ஆராய்வது முக்கியம். மென்பொருள் செலவுகள் இரட்டிப்பாகும் சாத்தியக்கூறுகளை நியாயப்படுத்த B300 இரண்டு மடங்கு AI செயலாக்க சக்தியை வழங்குகிறதா? விவரக்குறிப்புகள் மிகவும் நுணுக்கமான படத்தைக் காட்டுகின்றன.
HGX B300 மேம்பாடுகளைக் கொண்டுள்ளது:
- அதிகரித்த நினைவகத் திறன்: இது ஒரு அமைப்புக்கு சுமார் 2.3 டெராபைட்ஸ் உயர்-அகலக்கற்றை நினைவகத்தை (HBM) வழங்குகிறது, இது B200 இல் கிடைக்கும் 1.5TB உடன் ஒப்பிடும்போது சுமார் 1.5 மடங்கு குறிப்பிடத்தக்க பாய்ச்சலாகும். பெரிய AI மாதிரிகள் மற்றும் தரவுத்தொகுப்புகளைக் கையாள்வதற்கு இது முக்கியமானது.
- மேம்படுத்தப்பட்ட குறைந்த-துல்லிய செயல்திறன்: B300 ஆனது 4-பிட் மிதக்கும்-புள்ளி (FP4) துல்லியத்தைப் பயன்படுத்தி கணக்கீடுகளுக்கான செயல்திறனில் குறிப்பிடத்தக்க உயர்வை நிரூபிக்கிறது. அதன் FP4 செயல்திறன் ஒரு அமைப்புக்கு 105 அடர்த்தியான petaFLOPS ஐ விட சற்று அதிகமாக அடைகிறது, இது B200 ஐ விட சுமார் 50% அதிகமாகும். குறைந்த துல்லியம் ஏற்றுக்கொள்ளக்கூடிய சில AI அனுமானப் பணிகளுக்கு இந்த முடுக்கம் குறிப்பாக நன்மை பயக்கும்.
இருப்பினும், செயல்திறன் நன்மை அனைத்து பணிச்சுமைகளிலும் உலகளாவியது அல்ல. முக்கியமாக, அதிக துல்லியமான மிதக்கும்-புள்ளி எண்கணிதம் (FP8, FP16, அல்லது FP32 போன்றவை) தேவைப்படும் பணிகளுக்கு, B300 பழைய B200 அமைப்பை விட குறிப்பிடத்தக்க மிதக்கும்-புள்ளி செயல்பாடுகள் நன்மையை வழங்காது. பல சிக்கலான AI பயிற்சி மற்றும் அறிவியல் கணினிப் பணிகள் இந்த உயர் துல்லிய வடிவங்களை பெரிதும் நம்பியுள்ளன.
எனவே, B300 ஐ மதிப்பிடும் நிறுவனங்கள் ஒரு சிக்கலான கணக்கீட்டை எதிர்கொள்கின்றன. அவர்கள் கணிசமான நினைவகத் திறனையும் FP4 செயல்திறனில் ஒரு ஊக்கத்தையும் பெறுகிறார்கள், ஆனால் AI Enterprise மென்பொருள் செலவுகள் இரட்டிப்பாகும் சாத்தியக்கூறு அவர்களின் குறிப்பிட்ட, உயர்-துல்லிய பணிச்சுமைகளுக்கான செயல்திறன் இரட்டிப்புடன் பொருந்தாமல் போகலாம். மதிப்பு முன்மொழிவு இயக்கப்படும் AI பணிகளின் தன்மையைப் பொறுத்து மிகவும் சார்ந்துள்ளது.
தொழில்நுட்ப நியாயம்: இடை இணைப்புகள் மற்றும் சுதந்திரம்
சுவாரஸ்யமாக, இந்த புதிய டை-எண்ணும் முறை GTC இல் அறிவிக்கப்பட்ட அனைத்து புதிய Blackwell-அடிப்படையிலான அமைப்புகளிலும் உலகளாவிய ரீதியில் பயன்படுத்தப்படவில்லை. உதாரணமாக, அதிக சக்திவாய்ந்த, திரவ-குளிரூட்டப்பட்ட GB300 NVL72 அமைப்புகள், உரிம நோக்கங்களுக்காக முழு தொகுப்பையும் (இரண்டு டைகளைக் கொண்டது) ஒற்றை GPU ஆகக் கணக்கிடும் பழைய மரபைப் பின்பற்றுகின்றன. இந்த வேறுபாடு கேள்வியை எழுப்புகிறது: ஏன் இந்த வேறுபாடு?
Nvidia GPU தொகுப்புகளுக்குள் உள்ள இடை இணைப்பு தொழில்நுட்பத்தில் வேரூன்றிய ஒரு தொழில்நுட்ப பகுத்தறிவை வழங்குகிறது. Nvidia’வின் ஹைப்பர்ஸ்கேல் மற்றும் HPC க்கான துணைத் தலைவர் மற்றும் பொது மேலாளர் Ian Buck இன் கூற்றுப்படி, வேறுபாடு தொகுப்புக்குள் உள்ள இரண்டு டைகளை நேரடியாக இணைக்கும் ஒரு முக்கியமான சிப்-டு-சிப் (C2C) இடை இணைப்பு இருப்பதில் அல்லது இல்லாததில் உள்ளது.
HGX B300 உள்ளமைவு: காற்று-குளிரூட்டப்பட்ட HGX B300 அமைப்புகளில் பயன்படுத்தப்படும் குறிப்பிட்ட Blackwell தொகுப்புகளில் இந்த நேரடி C2C இடை இணைப்பு இல்லை. Buck விளக்கியது போல், இந்த வடிவமைப்புத் தேர்வு காற்று-குளிரூட்டப்பட்ட சேசிஸ் கட்டுப்பாடுகளுக்குள் மின் நுகர்வு மற்றும் வெப்ப மேலாண்மையை மேம்படுத்துவதற்காக செய்யப்பட்டது. இதன் விளைவு, ஒரு B300 தொகுதியில் உள்ள இரண்டு டைகள் அதிக அளவு சுதந்திரத்துடன் செயல்படுகின்றன. ஒரு டை அதே தொகுதியில் உள்ள மற்றொரு டையுடன் இயற்பியல் ரீதியாக இணைக்கப்பட்ட உயர்-அகலக்கற்றை நினைவகத்தில் சேமிக்கப்பட்ட தரவை அணுக வேண்டும் என்றால், அது நேரடியாக அவ்வாறு செய்ய முடியாது. அதற்கு பதிலாக, தரவு கோரிக்கை தொகுப்பை விட்டு வெளியேற வேண்டும், வெளிப்புற NVLink நெட்வொர்க்கைக் கடக்க வேண்டும் (சேவையக மதர்போர்டில் உள்ள NVLink சுவிட்ச் சிப் வழியாக இருக்கலாம்), பின்னர் மற்ற டையின் நினைவகக் கட்டுப்படுத்திக்குத் திரும்ப வேண்டும். இந்த மாற்றுப்பாதை இவை இரண்டு செயல்பாட்டு ரீதியாக வேறுபட்ட செயலாக்க அலகுகள் என்பதை வலுப்படுத்துகிறது, அவை ஒரு பொதுவான தொகுப்பைப் பகிர்ந்து கொள்கின்றன, ஆனால் முழு நினைவகப் பகிர்வுக்கு வெளிப்புற தொடர்பு பாதைகள் தேவைப்படுகின்றன. இந்த பிரிப்பு, Nvidia வாதிடுகிறது, அவற்றை இரண்டு தனித்துவமான GPUகளாகக் கணக்கிடுவதை நியாயப்படுத்துகிறது.
GB300 NVL72 உள்ளமைவு: இதற்கு மாறாக, உயர்-நிலை GB300 அமைப்புகளில் பயன்படுத்தப்படும் ‘Superchip’ தொகுப்புகள் அதிவேக C2C இடை இணைப்பை தக்கவைத்துக் கொள்கின்றன. இந்த நேரடி இணைப்பு தொகுப்புக்குள் உள்ள இரண்டு டைகளை NVLink சுவிட்ச் வழியாக தொகுப்புக்கு வெளியே மாற்றுப்பாதை தேவையில்லாமல் மிகவும் திறமையாகவும் நேரடியாகவும் தொடர்பு கொள்ளவும் நினைவக வளங்களைப் பகிரவும் அனுமதிக்கிறது. அவை மிகவும் ஒத்திசைந்து செயல்பட முடியும் மற்றும் நினைவகத்தை தடையின்றி பகிர்ந்து கொள்ள முடியும் என்பதால், அவை மென்பொருள் மற்றும் உரிமக் கண்ணோட்டத்தில், ஒற்றை, ஒருங்கிணைந்த GPU ஆகக் கருதப்படுகின்றன, இது Blackwell கட்டமைப்பின் ஆரம்ப ‘ஒருங்கிணைந்த’ விளக்கத்துடன் ஒத்துப்போகிறது.
இந்த தொழில்நுட்ப வேறுபாடு மாறுபட்ட எண்ணும் முறைகளுக்கு ஒரு தர்க்கரீதியான அடிப்படையை வழங்குகிறது. B300 இன் டைகள் C2C இணைப்பு இல்லாததால் செயல்பாட்டு ரீதியாக மிகவும் பிரிக்கப்பட்டுள்ளன, இது இரண்டு-GPU எண்ணிக்கைக்கு நம்பகத்தன்மையை அளிக்கிறது. GB300 இன் டைகள் இறுக்கமாக இணைக்கப்பட்டுள்ளன, இது ஒற்றை-GPU எண்ணிக்கையை ஆதரிக்கிறது.
எதிர்காலத்தை நோக்குதல்: Vera Rubin முன்னுதாரணத்தை அமைக்கிறது
GB300 தற்போது ஒரு விதிவிலக்கைக் குறிக்கும் அதே வேளையில், B300 க்கு ஏற்றுக்கொள்ளப்பட்ட டை-எண்ணும் அணுகுமுறை Nvidia’வின் எதிர்கால திசையைக் குறிப்பதாகத் தெரிகிறது. நிறுவனம் ஏற்கனவே அதன் அடுத்த தலைமுறை தளம், Vera Rubin என்ற குறியீட்டுப் பெயரிடப்பட்டது, இது எதிர்காலத்தில் வெளியிடப்பட உள்ளது, இந்த புதிய பெயரிடலை முழுமையாக ஏற்றுக்கொள்ளும் என்று சமிக்ஞை செய்துள்ளது.
பெயரிடும் மரபு ஒரு துப்பை வழங்குகிறது. Rubin கட்டமைப்பை அடிப்படையாகக் கொண்ட அமைப்புகள் NVL144 போன்ற உயர் எண்களுடன் நியமிக்கப்படுகின்றன. இந்த நியமனம் தொகுதிகளை விட தனிப்பட்ட டைகளைக் கணக்கிடுவதை வலுவாகக் குறிக்கிறது. B300 தர்க்கத்தைப் பின்பற்றி, ஒரு NVL144 அமைப்பு ஒரு குறிப்பிட்ட எண்ணிக்கையிலான தொகுதிகளைக் கொண்டிருக்கும், ஒவ்வொன்றும் பல டைகளைக் கொண்டிருக்கும், உரிமம் மற்றும் விவரக்குறிப்பு நோக்கங்களுக்காக 144 எண்ணக்கூடிய GPU டைகளாக மொத்தம் இருக்கும்.
இந்த போக்கு Nvidia’வின் 2027 இன் பிற்பகுதியில் Vera Rubin Ultra தளத்திற்கான வரைபடத்தில் இன்னும் தெளிவாகத் தெரிகிறது. இந்த தளம் ஒரு ரேக்கிற்கு வியக்க வைக்கும் 576 GPUகளை பெருமைப்படுத்துகிறது. முன்பு பகுப்பாய்வு செய்தபடி, இந்த ஈர்க்கக்கூடிய எண் ஒரு ரேக்கிற்குள் 576 தனித்துவமான இயற்பியல் தொகுதிகளைப் பேக் செய்வதன் மூலம் அடையப்படவில்லை. அதற்கு பதிலாக, இது பெருக்க முறையில் பயன்படுத்தப்படும் புதிய எண்ணும் முன்னுதாரணத்தைப் பிரதிபலிக்கிறது. கட்டமைப்பு ஒரு ரேக்கிற்கு 144 இயற்பியல் தொகுதிகளை உள்ளடக்கியிருக்கலாம், ஆனால் ஒவ்வொரு தொகுதியும் நான்கு தனித்துவமான சிலிக்கான் டைகளைக் கொண்டிருக்கும். இதனால், 144 தொகுதிகள் ஒரு தொகுதிக்கு 4 டைகளால் பெருக்கப்பட்டு 576 ‘GPUகள்’ என்ற தலைப்புச் செய்தியை அளிக்கிறது.
இந்த முன்னோக்கு பார்வை B300 இன் டை-எண்ணும் முறை குறிப்பிட்ட காற்று-குளிரூட்டப்பட்ட அமைப்புகளுக்கான தற்காலிக சரிசெய்தல் மட்டுமல்ல, மாறாக Nvidia எதிர்கால தலைமுறைகளில் அதன் GPU வளங்களை அளவிடுவதற்கான அடிப்படை கொள்கையாகும் என்பதைக் குறிக்கிறது. Nvidia’வின் சுற்றுச்சூழல் அமைப்பில் முதலீடு செய்யும் வாடிக்கையாளர்கள் இந்த மாற்றம் தரநிலையாக மாறுவதை எதிர்பார்க்க வேண்டும்.
பேசப்படாத காரணி: மென்பொருள் வருவாய் ஓட்டங்களை அதிகரிப்பதா?
C2C இடை இணைப்பு தொடர்பான தொழில்நுட்ப விளக்கம் B300 இன் தனித்துவமான GPU கணக்கீட்டிற்கு ஒரு பகுத்தறிவை வழங்கினாலும், நேரம் மற்றும் குறிப்பிடத்தக்க நிதி தாக்கங்கள் தவிர்க்க முடியாமல் அடிப்படை வணிக நோக்கங்கள் பற்றிய ஊகங்களுக்கு வழிவகுக்கின்றன. ஆரம்பத்தில் பெயரிடல் ‘தவறு’ திருத்தம் என்று வழங்கப்பட்ட இந்த மறுவரையறை, தொடர்ச்சியான மென்பொருள் வருவாயை மேம்படுத்துவதற்கான ஒரு மூலோபாய நெம்புகோலாகவும் செயல்பட முடியுமா?
Blackwell அதன் ‘ஒருங்கிணைந்த, ஒற்றை GPU’ செய்தியுடன் முதலில் விவரிக்கப்பட்ட ஆண்டில், Nvidia கணிசமான வருவாய் வாய்ப்பு பயன்படுத்தப்படாமல் விடப்பட்டதை உணர்ந்திருக்கலாம். AI Enterprise தொகுப்பு Nvidia’வின் வணிகத்தின் வளர்ந்து வரும் மற்றும் உயர்-விளிம்பு அங்கத்தைக் குறிக்கிறது. அதன் உரிமத்தை இயற்பியல் தொகுதிகளை விட சிலிக்கான் டைகளின் எண்ணிக்கையுடன் நேரடியாக இணைப்பது, ஒவ்வொரு வன்பொருள் வரிசைப்படுத்தலிலிருந்தும் பெறப்பட்ட மென்பொருள் வருவாயை கணிசமாக அதிகரிப்பதற்கான ஒரு பாதையை வழங்குகிறது, குறிப்பாக Vera Rubin Ultra போன்ற எதிர்கால கட்டமைப்புகளில் ஒரு தொகுதிக்கு டை எண்ணிக்கை அதிகரிக்கும் போது.
GPU வரையறையில் இந்த மாற்றம் புதிய B300 அமைப்புகளுக்கான AI Enterprise உரிமச் செலவுகளை எவ்வாறு குறிப்பாக பாதிக்கும் என்று கேட்கப்பட்டபோது, Nvidia ஒரு குறிப்பிட்ட அளவு தெளிவின்மையைப் பேணிவந்தது. ஒரு நிறுவன செய்தித் தொடர்பாளர் நிதி விவரங்கள் இன்னும் பரிசீலனையில் இருப்பதாகத் தெரிவித்தார். ‘B300 க்கான விலை விவரங்கள் இன்னும் இறுதி செய்யப்படுகின்றன, மேலும் GTC முக்கிய உரையில் காட்டப்பட்டதைத் தாண்டி Rubin பற்றிப் பகிர எந்த விவரங்களும் இல்லை,’ என்று செய்தித் தொடர்பாளர் கூறினார், இது இந்த தளங்களில் AI Enterprise க்கான விலை கட்டமைப்பையும் உள்ளடக்கியது என்பதை வெளிப்படையாக உறுதிப்படுத்தினார்.
இறுதி செய்யப்படாத விலை நிர்ணயம் இல்லாதது, சில வன்பொருள் உள்ளமைவுகளில் எண்ணக்கூடிய GPUகளின் இரட்டிப்புடன் இணைந்து, எதிர்கால AI உள்கட்டமைப்பு முதலீடுகளைத் திட்டமிடும் வாடிக்கையாளர்களுக்கு நிச்சயமற்ற தன்மையை உருவாக்குகிறது. தொழில்நுட்ப நியாயங்கள் இருந்தாலும், மென்பொருள் சந்தா செலவுகளில் கணிசமான அதிகரிப்புக்கான சாத்தியக்கூறு பெரியதாக உள்ளது. இந்த மாற்றம் செமிகண்டக்டர் மதிப்புச் சங்கிலியில் மென்பொருளின் அதிகரித்து வரும் முக்கியத்துவத்தையும், உரிம அளவீடுகளை அடிப்படை சிலிக்கான் சிக்கலுடன் மிகவும் நெருக்கமாக சீரமைப்பதன் மூலம் அதன் விரிவான AI தளத்தை மிகவும் திறம்பட பணமாக்குவதற்கான Nvidia’வின் வெளிப்படையான மூலோபாயத்தையும் எடுத்துக்காட்டுகிறது. நிறுவனங்கள் அடுத்த தலைமுறை AI அமைப்புகளுக்கு பட்ஜெட் போடும்போது, ‘GPU’ இன் வரையறை திடீரென்று ஒரு முக்கியமான, மற்றும் சாத்தியமான மிகவும் விலை உயர்ந்த, மாறியாக மாறியுள்ளது.