একটি কৌতূহলী সংশোধন: Nvidia তার GPU গণনা পুনর্বিবেচনা করছে
সেমিকন্ডাক্টর উদ্ভাবনের উচ্চ ঝুঁকির মঞ্চে, Nvidia’র GPU Technology Conference (GTC) ভবিষ্যতের উন্মোচনের জন্য একটি প্রধান মঞ্চ হিসেবে কাজ করে। এর সাম্প্রতিকতম সমাবেশে, কৃত্রিম বুদ্ধিমত্তা এবং ত্বরান্বিত কম্পিউটিংয়ের অগ্রগতি ঘিরে প্রত্যাশিত প্রচারের মধ্যে, কোম্পানি একটি সূক্ষ্ম অথচ সম্ভাব্য গভীর পরিবর্তন এনেছে – এটি গ্রাফিক্স প্রসেসিং ইউনিট (GPU) কে মৌলিকভাবে কীভাবে সংজ্ঞায়িত করে তার একটি পরিবর্তন। এটি কেবল একটি প্রযুক্তিগত পাদটীকা ছিল না; এটি ছিল একটি পুনঃসমন্বয় যার সুদূরপ্রসারী প্রভাব রয়েছে, বিশেষ করে Nvidia’র উন্নত AI সমাধান স্থাপনের খরচ কাঠামোর বিষয়ে।
CEO Jensen Huang নিজেই GTC মঞ্চ থেকে সরাসরি এই পরিবর্তনের কথা উল্লেখ করেছেন, এটিকে তাদের অত্যাধুনিক Blackwell আর্কিটেকচার সম্পর্কিত পূর্ববর্তী একটি ভুলের সংশোধন হিসাবে তুলে ধরেছেন। ‘আমি যে ভুলগুলো করেছি তার মধ্যে একটি হল: Blackwell আসলে একটি Blackwell চিপের মধ্যে দুটি GPU,’ তিনি বলেন। উপস্থাপিত যুক্তিটি স্বচ্ছতা এবং সামঞ্জস্যের উপর দৃষ্টি নিবদ্ধ করে, বিশেষ করে NVLink, Nvidia’র উচ্চ-গতির ইন্টারকানেক্ট প্রযুক্তির সাথে যুক্ত নামকরণের নিয়মাবলী সম্পর্কিত। ‘আমরা সেই একটি চিপকে GPU বলেছিলাম এবং সেটা ভুল ছিল। এর কারণ হল এটি সমস্ত NVLink নামকরণকে গুলিয়ে ফেলে,’ Huang বিস্তারিত বলেন। যদিও মডেল নম্বর সরলীকরণ একটি যৌক্তিক পরিচ্ছন্নতা প্রদান করে, এই পুনঃসংজ্ঞা নিছক শব্দার্থবিদ্যার বাইরেও অনেক বেশি ওজন বহন করে।
এই পরিবর্তনের মূল বিষয় হল ফিজিক্যাল মডিউল (বিশেষত, উচ্চ-পারফরম্যান্স সার্ভারগুলিতে সাধারণ SXM ফর্ম ফ্যাক্টর) কে পৃথক GPU হিসাবে গণনা করা থেকে সরে এসে সেই মডিউলগুলির মধ্যে স্বতন্ত্র সিলিকন ডাই (dies) গণনা করা। পরিভাষার এই আপাতদৃষ্টিতে ছোটখাটো সমন্বয় Nvidia’র AI Enterprise সফটওয়্যার স্যুট ব্যবহারকারী সংস্থাগুলির জন্য আর্থিক চিত্রকে নাটকীয়ভাবে পরিবর্তন করার সম্ভাবনা রাখে।
আর্থিক প্রভাব: AI Enterprise লাইসেন্সিং দ্বিগুণ করা?
Nvidia’র AI Enterprise হল একটি ব্যাপক সফটওয়্যার প্ল্যাটফর্ম যা AI অ্যাপ্লিকেশনগুলির বিকাশ এবং স্থাপনাকে সহজতর করার জন্য ডিজাইন করা হয়েছে। এটি সরঞ্জাম, ফ্রেমওয়ার্ক এবং গুরুত্বপূর্ণভাবে, Nvidia Inference Microservices (NIMs) এর অ্যাক্সেস অন্তর্ভুক্ত করে, যা AI মডেলগুলিকে দক্ষতার সাথে চালানোর জন্য অপ্টিমাইজ করা কন্টেইনার। এই শক্তিশালী স্যুটের লাইসেন্সিং মডেল ঐতিহাসিকভাবে স্থাপন করা GPU সংখ্যার সাথে সরাসরি যুক্ত ছিল। বর্তমান মূল্যের কাঠামো অনুযায়ী খরচ প্রায় প্রতি GPU প্রতি বছরে $4,500, অথবা ক্লাউড-ভিত্তিক হারে প্রতি GPU প্রতি ঘন্টায় $1।
পূর্ববর্তী প্রজন্ম বা নির্দিষ্ট Blackwell কনফিগারেশন বিবেচনা করুন। একটি Nvidia HGX B200 সার্ভার, আটটি SXM মডিউল দিয়ে সজ্জিত, যেখানে প্রতিটি মডিউলে তখন একটি একক Blackwell GPU হিসাবে বিবেচিত হত, তার জন্য আটটি AI Enterprise লাইসেন্সের প্রয়োজন হত। এটি একটি বার্ষিক সফটওয়্যার সাবস্ক্রিপশন খরচ $36,000 (8 GPUs * $4,500/GPU) বা একটি ঘন্টায় ক্লাউড খরচ $8 (8 GPUs * $1/GPU/hour) এ অনুবাদিত হত।
এখন, HGX B300 NVL16 এর মতো সিস্টেমগুলির সাথে নতুন সংজ্ঞায়িত ক্ষেত্রে প্রবেশ করুন। এই সিস্টেমেও আটটি ফিজিক্যাল SXM মডিউল রয়েছে। যাইহোক, সংশোধিত সংজ্ঞার অধীনে, Nvidia এখন এই মডিউলগুলির মধ্যে প্রতিটি সিলিকন ডাইকে একটি পৃথক GPU হিসাবে গণনা করে। যেহেতু এই নির্দিষ্ট কনফিগারেশনের প্রতিটি মডিউলে দুটি ডাই রয়েছে, লাইসেন্সিংয়ের উদ্দেশ্যে মোট GPU গণনা কার্যকরভাবে দ্বিগুণ হয়ে 16 GPUs (8 মডিউল * 2 ডাই/মডিউল) হয়।
ধরে নেওয়া যাক Nvidia AI Enterprise স্যুটের জন্য তার বিদ্যমান প্রতি-GPU মূল্যের কাঠামো বজায় রাখে – একটি বিষয় যা কোম্পানি বলেছে এখনও চূড়ান্ত হয়নি – এর প্রভাব স্পষ্ট। সেই একই আট-মডিউলের HGX B300 সিস্টেমের জন্য এখন সম্ভাব্য 16টি লাইসেন্সের প্রয়োজন হবে, যা বার্ষিক সফটওয়্যার খরচকে $72,000 (16 GPUs * $4,500/GPU) বা ক্লাউডে প্রতি ঘন্টায় $16 এ উন্নীত করবে। এটি আপাতদৃষ্টিতে তুলনামূলক হার্ডওয়্যার ঘনত্বের জন্য সফটওয়্যার সাবস্ক্রিপশন খরচে 100% বৃদ্ধি প্রতিনিধিত্ব করে, যা সরাসরি ‘GPU’ কীভাবে গণনা করা হয় তার পরিবর্তন থেকে উদ্ভূত।
দুটি আর্কিটেকচারের গল্প: অতীতের বিবৃতিগুলির সামঞ্জস্য বিধান
নামকরণের এই পরিবর্তন Nvidia’র Blackwell আর্কিটেকচারের পূর্ববর্তী বৈশিষ্ট্যগুলির সাথে একটি আকর্ষণীয় বৈপরীত্য উপস্থাপন করে। যখন Blackwell প্রাথমিকভাবে উন্মোচন করা হয়েছিল, তখন এর ডিজাইন নিয়ে আলোচনা উঠেছিল, যা একটি একক প্রসেসর প্যাকেজের মধ্যে একাধিক সিলিকন খণ্ড (ডাই) একসাথে যুক্ত করে। সেই সময়ে, Nvidia সক্রিয়ভাবে Blackwell কে ‘চিপলেট’ আর্কিটেকচার শব্দটি ব্যবহার করে বর্ণনা করার বিরুদ্ধে যুক্তি দিয়েছিল – একাধিক ছোট, আন্তঃসংযুক্ত ডাই ব্যবহার করে ডিজাইনের জন্য একটি সাধারণ শিল্প পরিভাষা। পরিবর্তে, কোম্পানি একটি ভিন্ন দৃষ্টিকোণকে জোর দিয়েছিল।
Blackwell লঞ্চ কভারেজের সময় যেমন রিপোর্ট করা হয়েছিল, Nvidia যুক্তি দিয়েছিল যে এটি একটি ‘টু-রেটিকল লিমিটেড ডাই আর্কিটেকচার ব্যবহার করেছে যা একটি একীভূত, একক GPU হিসাবে কাজ করে।’ এই বাক্যটি দৃঢ়ভাবে পরামর্শ দিয়েছিল যে দুটি ডাইয়ের শারীরিক উপস্থিতি সত্ত্বেও, তারা একটি যৌক্তিক প্রক্রিয়াকরণ ইউনিট হিসাবে সম্মিলিতভাবে কাজ করে। B300 কনফিগারেশনে প্রয়োগ করা নতুন গণনা পদ্ধতিটি এই ‘একীভূত, একক GPU’ ধারণা থেকে সরে আসছে বলে মনে হচ্ছে, অন্তত সফটওয়্যার লাইসেন্সিংয়ের দৃষ্টিকোণ থেকে, ডাইগুলিকে স্বতন্ত্র সত্তা হিসাবে বিবেচনা করে। এটি প্রশ্ন উত্থাপন করে যে প্রাথমিক বিবরণটি প্রাথমিকভাবে হার্ডওয়্যারের কার্যকরী সম্ভাবনার উপর দৃষ্টি নিবদ্ধ ছিল নাকি লাইসেন্সিংয়ের কৌশলগত দৃষ্টিকোণ বিকশিত হয়েছে।
পারফরম্যান্স লাভ বনাম সম্ভাব্য খরচ বৃদ্ধি: B300 প্রস্তাবনার মূল্যায়ন
HGX B300 এর জন্য সফটওয়্যার লাইসেন্সিং ফি দ্বিগুণ হওয়ার সম্ভাবনার কথা বিবেচনা করার সময়, এর পূর্বসূরি যেমন B200 এর তুলনায়, নতুন হার্ডওয়্যার দ্বারা প্রদত্ত পারফরম্যান্স বৃদ্ধি পরীক্ষা করা অত্যন্ত গুরুত্বপূর্ণ। সম্ভাব্য দ্বিগুণ সফটওয়্যার খরচের ন্যায্যতা প্রমাণের জন্য B300 কি দ্বিগুণ AI প্রক্রিয়াকরণ শক্তি সরবরাহ করে? স্পেসিফিকেশনগুলি একটি আরও সূক্ষ্ম চিত্র নির্দেশ করে।
HGX B300 কিছু উন্নতি গর্ব করে:
- বর্ধিত মেমরি ক্ষমতা: এটি প্রতি সিস্টেমে প্রায় 2.3 টেরাবাইট উচ্চ-ব্যান্ডউইথ মেমরি (HBM) সরবরাহ করে, যা B200 এ উপলব্ধ 1.5TB এর তুলনায় প্রায় 1.5 গুণ বৃদ্ধি। এটি বৃহত্তর AI মডেল এবং ডেটাসেটগুলি পরিচালনা করার জন্য অত্যন্ত গুরুত্বপূর্ণ।
- উন্নত লো-প্রিসিশন পারফরম্যান্স: B300 4-বিট ফ্লোটিং-পয়েন্ট (FP4) প্রিসিশন ব্যবহার করে গণনার জন্য পারফরম্যান্সে একটি উল্লেখযোগ্য উন্নতি প্রদর্শন করে। এর FP4 থ্রুপুট প্রতি সিস্টেমে 105 ডেন্স পেটাফ্লপস এর সামান্য বেশি, যা B200 এর তুলনায় প্রায় 50% বৃদ্ধি। এই ত্বরণ নির্দিষ্ট AI ইনফারেন্স কাজের জন্য বিশেষভাবে উপকারী যেখানে নিম্ন নির্ভুলতা গ্রহণযোগ্য।
যাইহোক, পারফরম্যান্স সুবিধা সব ওয়ার্কলোডের ক্ষেত্রে সার্বজনীন নয়। গুরুত্বপূর্ণভাবে, উচ্চতর নির্ভুলতার ফ্লোটিং-পয়েন্ট গাণিতিক (যেমন FP8, FP16, বা FP32) প্রয়োজন এমন কাজের জন্য, B300 পুরানো B200 সিস্টেমের তুলনায় উল্লেখযোগ্য ফ্লোটিং-পয়েন্ট অপারেশন সুবিধা প্রদান করে না। অনেক জটিল AI প্রশিক্ষণ এবং বৈজ্ঞানিক কম্পিউটিং কাজগুলি এই উচ্চতর নির্ভুলতার ফর্ম্যাটগুলির উপর ব্যাপকভাবে নির্ভর করে।
অতএব, B300 মূল্যায়নকারী সংস্থাগুলি একটি জটিল গণনার মুখোমুখি হয়। তারা যথেষ্ট মেমরি ক্ষমতা এবং FP4 পারফরম্যান্সে একটি বুস্ট পায়, কিন্তু AI Enterprise সফটওয়্যার খরচের সম্ভাব্য দ্বিগুণ বৃদ্ধি তাদের নির্দিষ্ট, উচ্চ-নির্ভুলতার ওয়ার্কলোডগুলির জন্য পারফরম্যান্সের অনুরূপ দ্বিগুণ বৃদ্ধির সাথে নাও মিলতে পারে। ভ্যালু প্রোপোজিশনটি চালানো হচ্ছে এমন AI কাজের প্রকৃতির উপর অত্যন্ত নির্ভরশীল হয়ে ওঠে।
প্রযুক্তিগত ন্যায্যতা: ইন্টারকানেক্ট এবং স্বাধীনতা
কৌতূহলজনকভাবে, এই নতুন ডাই-গণনা পদ্ধতি GTC-তে ঘোষিত সমস্ত নতুন Blackwell-ভিত্তিক সিস্টেমে সর্বজনীনভাবে প্রয়োগ করা হয় না। উদাহরণস্বরূপ, আরও শক্তিশালী, লিকুইড-কুলড GB300 NVL72 সিস্টেমগুলি পুরানো নিয়ম মেনে চলতে থাকে, লাইসেন্সিংয়ের উদ্দেশ্যে পুরো প্যাকেজটিকে (দুটি ডাই ধারণকারী) একটি একক GPU হিসাবে গণনা করে। এই ভিন্নতা প্রশ্ন জাগায়: পার্থক্য কেন?
Nvidia GPU প্যাকেজগুলির মধ্যেইন্টারকানেক্ট প্রযুক্তিতে নিহিত একটি প্রযুক্তিগত যুক্তি প্রদান করে। Nvidia’র হাইপারস্কেল এবং HPC-এর ভাইস প্রেসিডেন্ট এবং জেনারেল ম্যানেজার Ian Buck এর মতে, পার্থক্যটি প্যাকেজের মধ্যে দুটি ডাইকে সরাসরি সংযোগকারী একটি গুরুত্বপূর্ণ চিপ-টু-চিপ (C2C) ইন্টারকানেক্ট এর উপস্থিতি বা অনুপস্থিতিতে নিহিত।
HGX B300 কনফিগারেশন: এয়ার-কুলড HGX B300 সিস্টেমে ব্যবহৃত নির্দিষ্ট Blackwell প্যাকেজগুলিতে এই সরাসরি C2C ইন্টারকানেক্টের অভাব রয়েছে। Buck যেমন ব্যাখ্যা করেছেন, এই ডিজাইন পছন্দটি এয়ার-কুলড চ্যাসিসের সীমাবদ্ধতার মধ্যে পাওয়ার খরচ এবং থার্মাল ম্যানেজমেন্ট অপ্টিমাইজ করার জন্য করা হয়েছিল। এর ফলস্বরূপ, একটি একক B300 মডিউলের দুটি ডাই বৃহত্তর মাত্রার স্বাধীনতার সাথে কাজ করে। যদি একটি ডাইকে একই মডিউলের অন্য ডাইয়ের সাথে ফিজিক্যালি সংযুক্ত হাই-ব্যান্ডউইথ মেমরিতে সংরক্ষিত ডেটা অ্যাক্সেস করতে হয়, তবে এটি সরাসরি তা করতে পারে না। পরিবর্তে, ডেটা অনুরোধটিকে প্যাকেজের বাইরে যেতে হবে, এক্সটার্নাল NVLink নেটওয়ার্ক (সম্ভবত সার্ভার মাদারবোর্ডের একটি NVLink সুইচ চিপের মাধ্যমে) অতিক্রম করতে হবে এবং তারপরে অন্য ডাইয়ের মেমরি কন্ট্রোলারে ফিরে যেতে হবে। এই পরোক্ষ পথটি এই ধারণাকে শক্তিশালী করে যে এগুলি দুটি কার্যকরীভাবে স্বতন্ত্র প্রসেসিং ইউনিট যা একটি সাধারণ প্যাকেজ ভাগ করে তবে সম্পূর্ণ মেমরি শেয়ারিংয়ের জন্য বাহ্যিক যোগাযোগের পথের প্রয়োজন। এই পৃথকীকরণ, Nvidia যুক্তি দেয়, তাদের দুটি স্বতন্ত্র GPU হিসাবে গণনা করার ন্যায্যতা দেয়।
GB300 NVL72 কনফিগারেশন: বিপরীতে, উচ্চ-প্রান্তের GB300 সিস্টেমে ব্যবহৃত ‘Superchip’ প্যাকেজগুলি উচ্চ-গতির C2C ইন্টারকানেক্ট ধরে রাখে। এই সরাসরি লিঙ্কটি প্যাকেজের মধ্যে দুটি ডাইকে NVLink সুইচের মাধ্যমে প্যাকেজের বাইরের পরোক্ষ পথের প্রয়োজন ছাড়াই অনেক বেশি দক্ষতার সাথে এবং সরাসরি যোগাযোগ করতে এবং মেমরি রিসোর্স শেয়ার করতে দেয়। কারণ তারা আরও সম্মিলিতভাবে কাজ করতে পারে এবং নির্বিঘ্নে মেমরি শেয়ার করতে পারে, তাদের সফটওয়্যার এবং লাইসেন্সিং দৃষ্টিকোণ থেকে একটি একক, একীভূত GPU হিসাবে বিবেচনা করা হয়, যা Blackwell আর্কিটেকচারের প্রাথমিক ‘একীভূত’ বর্ণনার সাথে সামঞ্জস্যপূর্ণ।
এই প্রযুক্তিগত পার্থক্য ভিন্ন ভিন্ন গণনা পদ্ধতির জন্য একটি যৌক্তিক ভিত্তি প্রদান করে। B300 এর ডাইগুলি C2C লিঙ্কের অভাবের কারণে কার্যকরীভাবে আরও পৃথক, যা দুটি-GPU গণনার বিশ্বাসযোগ্যতা দেয়। GB300 এর ডাইগুলি শক্তভাবে সংযুক্ত, যা একক-GPU গণনা সমর্থন করে।
ভবিষ্যতের দিকে দৃষ্টিপাত: Vera Rubin নজির স্থাপন করছে
যদিও GB300 বর্তমানে একটি ব্যতিক্রমের প্রতিনিধিত্ব করে, B300 এর জন্য গৃহীত ডাই-গণনা পদ্ধতি Nvidia’র ভবিষ্যতের দিকনির্দেশনার সূচক বলে মনে হচ্ছে। কোম্পানি ইতিমধ্যে ইঙ্গিত দিয়েছে যে তার পরবর্তী প্রজন্মের প্ল্যাটফর্ম, কোডনাম Vera Rubin, যা আরও পরে প্রকাশের জন্য নির্ধারিত, সম্পূর্ণরূপে এই নতুন নামকরণ গ্রহণ করবে।
নামকরণ পদ্ধতি নিজেই একটি সূত্র প্রদান করে। Rubin আর্কিটেকচারের উপর ভিত্তি করে সিস্টেমগুলিকে উচ্চ সংখ্যা দিয়ে মনোনীত করা হচ্ছে, যেমন NVL144। এই উপাধিটি মডিউলের পরিবর্তে পৃথক ডাই গণনার দৃঢ়ভাবে ইঙ্গিত দেয়। B300 যুক্তি অনুসরণ করে, একটি NVL144 সিস্টেম সম্ভবত নির্দিষ্ট সংখ্যক মডিউল নিয়ে গঠিত হবে, যার প্রতিটিতে একাধিক ডাই থাকবে, যা লাইসেন্সিং এবং স্পেসিফিকেশন উদ্দেশ্যে 144টি গণনাযোগ্য GPU ডাইয়ের সমষ্টি হবে।
এই প্রবণতাটি Nvidia’র 2027 সালের শেষের দিকের Vera Rubin Ultra প্ল্যাটফর্মের রোডম্যাপে আরও স্পষ্ট। এই প্ল্যাটফর্মটি প্রতি র্যাকে একটি বিস্ময়কর 576 GPUs গর্ব করে। পূর্বে বিশ্লেষণ করা হিসাবে, এই চিত্তাকর্ষক সংখ্যাটি একটি র্যাকে 576টি স্বতন্ত্র ফিজিক্যাল মডিউল প্যাক করে অর্জন করা হয় না। পরিবর্তে, এটি গুণিতকভাবে প্রয়োগ করা নতুন গণনা দৃষ্টান্তকে প্রতিফলিত করে। আর্কিটেকচারটি সম্ভবত প্রতি র্যাকে 144টি ফিজিক্যাল মডিউল জড়িত, তবে প্রতিটিমডিউলে চারটি স্বতন্ত্র সিলিকন ডাই রয়েছে। এইভাবে, 144টি মডিউলকে প্রতি মডিউলে 4টি ডাই দিয়ে গুণ করলে 576 ‘GPUs’ এর শিরোনাম চিত্র পাওয়া যায়।
এই দূরদর্শী দৃষ্টিকোণটি পরামর্শ দেয় যে B300 এর ডাই-গণনা পদ্ধতি কেবল নির্দিষ্ট এয়ার-কুলড সিস্টেমগুলির জন্য একটি অস্থায়ী সমন্বয় নয় বরং Nvidia ভবিষ্যতের প্রজন্মগুলিতে তার GPU সংস্থানগুলি কীভাবে পরিমাণ নির্ধারণ করতে চায় তার ভিত্তিগত নীতি। Nvidia’র ইকোসিস্টেমে বিনিয়োগকারী গ্রাহকদের এই পরিবর্তনটি স্ট্যান্ডার্ড হয়ে উঠবে বলে আশা করা উচিত।
অনুক্ত কারণ: সফটওয়্যার রাজস্ব ধারা সর্বাধিকীকরণ?
যদিও C2C ইন্টারকানেক্ট সম্পর্কিত প্রযুক্তিগত ব্যাখ্যা B300 এর স্বতন্ত্র GPU গণনার জন্য একটি যুক্তি প্রদান করে, সময় এবং উল্লেখযোগ্য আর্থিক প্রভাব অনিবার্যভাবে অন্তর্নিহিত ব্যবসায়িক উদ্দেশ্য সম্পর্কে জল্পনা-কল্পনার দিকে নিয়ে যায়। এই পুনঃসংজ্ঞা, যা প্রাথমিকভাবে নামকরণের ‘ভুল’ সংশোধন হিসাবে উপস্থাপিত হয়েছিল, তা কি পুনরাবৃত্ত সফটওয়্যার রাজস্ব বাড়ানোর জন্য একটি কৌশলগত লিভার হিসাবেও কাজ করতে পারে?
Blackwell প্রথম তার ‘একীভূত, একক GPU’ বার্তার সাথে বিস্তারিত হওয়ার পর থেকে এক বছরে, এটা সম্ভব যে Nvidia একটি উল্লেখযোগ্য রাজস্ব সুযোগকে অব্যবহৃত রেখে দিয়েছে বলে স্বীকার করেছে। AI Enterprise স্যুট Nvidia’র ব্যবসার একটি ক্রমবর্ধমান এবং উচ্চ-মার্জিন উপাদান প্রতিনিধিত্ব করে। ফিজিক্যাল মডিউলের পরিবর্তে সিলিকন ডাইয়ের সংখ্যার সাথে সরাসরি এর লাইসেন্সিং যুক্ত করা প্রতিটি হার্ডওয়্যার স্থাপনা থেকে প্রাপ্ত সফটওয়্যার রাজস্ব উল্লেখযোগ্যভাবে বৃদ্ধি করার একটি পথ সরবরাহ করে, বিশেষ করে যখন Vera Rubin Ultra এর মতো ভবিষ্যতের আর্কিটেকচারে প্রতি মডিউলে ডাইয়ের সংখ্যা সম্ভাব্যভাবে বৃদ্ধি পায়।
GPU সংজ্ঞার এই পরিবর্তন কীভাবে নতুন B300 সিস্টেমগুলির জন্য AI Enterprise লাইসেন্সিং খরচকে বিশেষভাবে প্রভাবিত করবে সে সম্পর্কে জিজ্ঞাসা করা হলে, Nvidia একটি নির্দিষ্ট মাত্রার অস্পষ্টতা বজায় রেখেছে। একজন কোম্পানির মুখপাত্র জানিয়েছেন যে আর্থিক বিবরণ এখনও বিবেচনাধীন ছিল। ‘B300 এর জন্য মূল্যের বিবরণ এখনও চূড়ান্ত করা হচ্ছে এবং GTC কিনোটে যা দেখানো হয়েছিল তার বাইরে Rubin সম্পর্কে এই সময়ে ভাগ করার মতো কোনও বিবরণ নেই,’ মুখপাত্র বলেছেন, স্পষ্টভাবে নিশ্চিত করেছেন যে এর মধ্যে এই প্ল্যাটফর্মগুলিতে AI Enterprise এর মূল্যের কাঠামো অন্তর্ভুক্ত রয়েছে।
চূড়ান্ত মূল্যের এই অভাব, নির্দিষ্ট হার্ডওয়্যার কনফিগারেশনে গণনাযোগ্য GPU দ্বিগুণ হওয়ার সাথে মিলিত, ভবিষ্যতের AI পরিকাঠামো বিনিয়োগের পরিকল্পনা করা গ্রাহকদের জন্য অনিশ্চয়তা তৈরি করে। যদিও প্রযুক্তিগত ন্যায্যতা উপস্থিত রয়েছে, সফটওয়্যার সাবস্ক্রিপশন খরচে একটি উল্লেখযোগ্য বৃদ্ধির সম্ভাবনা বড় হয়ে দেখা দিয়েছে। এই পরিবর্তনটি সেমিকন্ডাক্টর ভ্যালু চেইনে সফটওয়্যারের ক্রমবর্ধমান গুরুত্ব এবং অন্তর্নিহিত সিলিকন জটিলতার সাথে লাইসেন্সিং মেট্রিকগুলিকে আরও ঘনিষ্ঠভাবে সারিবদ্ধ করে তার ব্যাপক AI প্ল্যাটফর্মকে আরও কার্যকরভাবে নগদীকরণ করার Nvidia’র আপাত কৌশলকে তুলে ধরে। সংস্থাগুলি যখন পরবর্তী প্রজন্মের AI সিস্টেমগুলির জন্য বাজেট তৈরি করে, তখন ‘GPU’ এর সংজ্ঞা হঠাৎ করেই একটি গুরুত্বপূর্ণ এবং সম্ভাব্যভাবে অনেক বেশি ব্যয়বহুল পরিবর্তনশীল হয়ে উঠেছে।