ابر تراشه های جدید انویدیا: بلک‌ول و ورا روبین

Blackwell Ultra GB300: جهشی در عملکرد

انتظار می‌رود Blackwell Ultra GB300 در نیمه دوم سال 2025 عرضه شود و پیشرفت قابل‌توجهی نسبت به محصولات قبلی NVIDIA نشان می‌دهد. این ابرتراشه جدید برای ارائه توان محاسباتی بیشتر و پهنای باند حافظه افزایش‌یافته مهندسی شده است، که برای پاسخگویی به تقاضاهای روزافزون برنامه‌های کاربردی هوش مصنوعی مدرن ضروری است.

سیستم GB300 یک نیروگاه قدرتمند است که 72 عدد NVIDIA Blackwell Ultra GPU و 36 عدد NVIDIA Grace CPU مبتنی بر Arm را ادغام می‌کند. این ترکیب، 1400 پتافلاپس عملکرد FP4 AI را ارائه می‌دهد. برای درک بهتر، این میزان 1.5 برابر افزایش در قابلیت محاسبات متراکم FP4 در مقایسه با نسل قبلی خود، یعنی Blackwell B200 است.

یکی از مهم‌ترین ارتقاء‌ها در GB300، ظرفیت حافظه آن است. هر GPU در این سیستم به 288 گیگابایت حافظه HBM3e مجهز شده است. این مقدار به بیش از 20 ترابایت حافظه GPU در هر سیستم می‌رسد. این افزایش قابل‌توجه در حافظه، امکان پردازش مدل‌های هوش مصنوعی و مجموعه داده‌های بسیار بزرگ‌تر را فراهم می‌کند، محاسبات پیچیده‌تر را ممکن می‌سازد و به سرعت پردازش سریع‌تری دست می‌یابد.

NVIDIA پلتفرم Blackwell Ultra AI Factory را به عنوان ارائه دهنده دستاوردهای عملکردی افزایشی، و نه انقلابی، در مقایسه با تراشه‌های استاندارد Blackwell معرفی می‌کند. در حالی که یک تراشه Ultra منفرد، همان 20 پتافلاپس محاسبات هوش مصنوعی Blackwell استاندارد را حفظ می‌کند، به طور قابل‌توجهی از افزایش 50 درصدی حافظه با پهنای باند بالا (HBM3e) بهره می‌برد و از 192 گیگابایت به 288 گیگابایت افزایش می‌یابد.

با بررسی در مقیاس بزرگتر، یک “Superpod” DGX GB300 در مقیاس کامل، همچنان 288 پردازنده مرکزی و 576 پردازنده گرافیکی را در خود جای می‌دهد. این راه‌اندازی 11.5 اگزافلاپس محاسبات FP4 را ارائه می‌دهد که عملکرد Superpod مبتنی بر Blackwell اصلی را منعکس می‌کند. با این حال، دارای 25 درصد افزایش در کل حافظه است که اکنون به 300 ترابایت عظیم رسیده است. این پیشرفت‌های حافظه، تمرکز NVIDIA را بر تطبیق مدل‌های بزرگ‌تر و افزایش کارایی استدلال هوش مصنوعی برجسته می‌کند، نه اینکه صرفاً بر قدرت محاسباتی خام متمرکز باشد.

به جای مقایسه مستقیم Blackwell با Blackwell Ultra، NVIDIA نشان می‌دهد که چگونه جدیدترین پلتفرم آن با تراشه‌های H100 مربوط به سال 2022 مقایسه می‌شود، که هنوز به طور گسترده در بارهای کاری هوش مصنوعی استفاده می‌شوند. این شرکت ادعا می‌کند که Blackwell Ultra 1.5 برابر عملکرد استنتاج FP4 نسبت به H100 ارائه می‌دهد. با این حال، چشمگیرترین مزیت در توانایی آن برای تسریع استدلال هوش مصنوعی نهفته است.

به عنوان مثال، یک خوشه NVL72 که DeepSeek-R1 671B را اجرا می‌کند، یک مدل زبان فوق‌العاده بزرگ، اکنون می‌تواند پاسخ‌ها را تنها در ده ثانیه تولید کند. این کاهش چشمگیری نسبت به 90 ثانیه مورد نیاز در سیستم H100 است.

NVIDIA این پیشرفت چشمگیر را به افزایش ده برابری سرعت پردازش توکن نسبت می‌دهد. Blackwell Ultra می‌تواند 1000 توکن در ثانیه را پردازش کند، که جهشی قابل‌توجه نسبت به 100 توکن در ثانیه H100 است. این ارقام نشان می‌دهند که در حالی که Blackwell Ultra ممکن است به طور چشمگیری از نسل قبلی خود پیشی نگیرد، دستاوردهای کارایی قانع‌کننده‌ای را ارائه می‌دهد، به ویژه برای سازمان‌هایی که هنوز از معماری‌های نسل قبلی استفاده می‌کنند.

Vera Rubin Superchip: نسل بعدی پردازش هوش مصنوعی

فراتر از Blackwell Ultra، NVIDIA قصد دارد ابرتراشه Vera Rubin را در اواخر سال 2026 معرفی کند. این تراشه که به افتخار ستاره‌شناس برجسته Vera Rubin نامگذاری شده است، یک CPU (Vera) و GPU (Rubin) طراحی‌شده سفارشی را در خود جای خواهد داد. این نشان‌دهنده گامی مهم در تلاش NVIDIA برای دستیابی به قابلیت‌های پردازش هوش مصنوعی پیشرفته است.

CPU Vera، مبتنی بر معماری Olympus NVIDIA، پیش‌بینی می‌شود که دو برابر عملکرد CPUهای Grace فعلی را ارائه دهد. از سوی دیگر، GPU Rubin تا 288 گیگابایت حافظه با پهنای باند بالا را پشتیبانی می‌کند. این ظرفیت حافظه قابل‌توجه، قابلیت‌های پردازش داده را به ویژه برای وظایف پیچیده هوش مصنوعی به طور چشمگیری افزایش می‌دهد.

معماری Vera Rubin یک طراحی دوگانه GPU را روی یک قالب واحد به نمایش می‌گذارد. این طراحی نوآورانه، 50 پتافلاپس عملکرد استنتاج FP4 را در هر تراشه امکان‌پذیر می‌سازد و پردازش کارآمدتر و تأخیر کمتری را در برنامه‌های کاربردی هوش مصنوعی ایجاد می‌کند.

CPU Vera، که جانشین CPU Grace می‌شود، از 88 هسته Arm سفارشی با چند رشته‌ای همزمان تشکیل شده است. این پیکربندی منجر به 176 رشته در هر سوکت می‌شود. همچنین دارای یک رابط هسته به هسته NVLink با سرعت 1.8 ترابایت بر ثانیه است که سرعت انتقال داده بین اجزای CPU و GPU را به طور قابل‌توجهی بهبود می‌بخشد.

Blackwell Ultra GB300 و Vera Rubin Superchip پیشرفت‌های قابل‌توجهی نسبت به معماری‌های تراشه قبلی NVIDIA نشان می‌دهند. افزایش 1.5 برابری GB300 در محاسبات متراکم FP4 نسبت به B200 مستقیماً به پردازش کارآمدتر بارهای کاری هوش مصنوعی تبدیل می‌شود. این به نوبه خود، زمان آموزش و استنتاج سریع‌تری را امکان‌پذیر می‌کند، که برای تسریع توسعه هوش مصنوعی بسیار مهم است.

Vera Rubin، با 50 پتافلاپس عملکرد FP4 در هر تراشه، نشان‌دهنده یک جهش قابل‌توجه به جلو است. این سطح از عملکرد، امکان استقرار مدل‌ها و برنامه‌های کاربردی هوش مصنوعی پیچیده‌تر را فراهم می‌کند و مرزهای آنچه را که در زمینه هوش مصنوعی ممکن است، جابجا می‌کند.

جدول زمانی توسعه بلندپروازانه NVIDIA، با برنامه‌هایی برای انتشار سالانه نسل‌های جدید تراشه‌های هوش مصنوعی، بر تعهد آن به حفظ موقعیت پیشرو در بازار سخت‌افزار هوش مصنوعی که به سرعت در حال تحول است، تأکید می‌کند. تعهد این شرکت به نوآوری در پیگیری مداوم آن برای راه‌حل‌های پردازش هوش مصنوعی قدرتمندتر و کارآمدتر مشهود است. معرفی این ابرتراشه‌های جدید فقط در مورد پیشرفت‌های تدریجی نیست. بلکه در مورد فعال کردن عصر جدیدی از قابلیت‌های هوش مصنوعی است.

پیشرفت در ظرفیت حافظه و سرعت پردازش به ویژه قابل‌توجه است. توانایی مدیریت مدل‌ها و مجموعه داده‌های بزرگ‌تر برای توسعه سیستم‌های هوش مصنوعی پیچیده‌تر بسیار مهم است. از آنجایی که مدل‌های هوش مصنوعی همچنان در پیچیدگی رشد می‌کنند، نیاز به سخت‌افزاری که بتواند همگام باشد، به طور فزاینده‌ای مهم می‌شود. تمرکز NVIDIA بر پهنای باند حافظه و سرعت پردازش توکن مستقیماً به این نیاز پاسخ می‌دهد.

تغییر جهت به سمت تأکید بر دستاوردهای کارایی، به ویژه برای سازمان‌هایی که از معماری‌های قدیمی‌تر در حال گذار هستند، یک حرکت استراتژیک توسط NVIDIA است. این اذعان می‌کند که همه کاربران بلافاصله آخرین سخت‌افزار را نخواهند پذیرفت. NVIDIA با نشان دادن پیشرفت‌های عملکردی قابل‌توجه نسبت به تراشه‌های نسل قبلی، استدلال قانع‌کننده‌ای برای ارتقا ارائه می‌دهد.

ابرتراشه Vera Rubin، با CPU و GPU طراحی‌شده سفارشی خود، نشان‌دهنده یک پیشرفت معماری قابل‌توجه است. طراحی دوگانه GPU روی یک قالب واحد، یک رویکرد نوآورانه است که نوید ارائه دستاوردهای عملکردی قابل‌توجه و کاهش تأخیر را می‌دهد. این طراحی منعکس‌کننده تعهد NVIDIA به پیشبرد مرزهای طراحی تراشه و به حداکثر رساندن عملکرد است.

نامگذاری این تراشه به نام ستاره‌شناس Vera Rubin، ادای احترامی شایسته به کار پیشگامانه او است. همچنین به طور ظریفی تعهد NVIDIA به اکتشافات علمی و نوآوری را تقویت می‌کند. تمرکز این شرکت بر هوش مصنوعی فراتر از کاربردهای تجاری است. همچنین شامل پیشرفت تحقیقات علمی نیز می‌شود.

به طور کلی، اعلام ابرتراشه‌های Blackwell Ultra GB300 و Vera Rubin توسط NVIDIA، نقطه عطف مهمی در تکامل سخت‌افزار هوش مصنوعی است. این تراشه‌های جدید آماده‌اند تا توسعه و استقرار هوش مصنوعی را در طیف گسترده‌ای از صنایع تسریع کنند. تعهد این شرکت به نوآوری و جدول زمانی توسعه تهاجمی آن نشان می‌دهد که می‌توانیم انتظار پیشرفت‌های پیشگامانه‌تری را در سال‌های آینده داشته باشیم. تمرکز بر هر دو عملکرد خام و دستاوردهای کارایی تضمین می‌کند که این تراشه‌ها برای طیف گسترده‌ای از کاربران، از کسانی که دارای سیستم‌های پیشرفته هستند تا کسانی که هنوز از معماری‌های قدیمی‌تر استفاده می‌کنند، مرتبط خواهند بود. آینده سخت‌افزار هوش مصنوعی روشن به نظر می‌رسد و NVIDIA به وضوح خود را در خط مقدم این زمینه هیجان‌انگیز قرار می‌دهد. حافظه افزایش‌یافته، سرعت پردازش بهبودیافته و طراحی‌های نوآورانه این ابرتراشه‌های جدید بدون شک راه را برای پیشرفت‌های جدید در هوش مصنوعی هموار می‌کند، بخش‌های مختلف را تحت تأثیر قرار می‌دهد و پیشرفت‌های بیشتری را در سال‌های آینده به پیش می‌برد.