Blackwell Ultra GB300: Скок в производителността
Очаква се да бъде пуснат на пазара през втората половина на 2025 г., Blackwell Ultra GB300 представлява значителен напредък спрямо предишните предложения на NVIDIA. Този нов суперчип е проектиран да осигури подобрена изчислителна мощност и увеличена пропусквателна способност на паметта, което е от решаващо значение за посрещане на непрекъснато нарастващите изисквания на съвременните AI приложения.
Системата GB300 е изключително мощна, интегрирайки 72 NVIDIA Blackwell Ultra GPU и 36 Arm-базирани NVIDIA Grace CPU. Тази комбинация осигурява впечатляващите 1400 petaFLOPS FP4 AI производителност. За да го поставим в перспектива, това е 1,5 пъти увеличение на плътната FP4 изчислителна способност в сравнение с предшественика му, Blackwell B200.
Едно от най-значимите подобрения в GB300 е капацитетът на паметта му. Всеки GPU в системата е оборудван с изумителните 288GB HBM3e памет. Това възлиза на общо над 20TB GPU памет на система. Това значително увеличение на паметта позволява обработката на много по-големи AI модели и набори от данни, позволявайки по-сложни изчисления и постигане на по-високи скорости на обработка.
NVIDIA позиционира Blackwell Ultra AI Factory Platform като предлагаща постепенни, а не революционни, увеличения на производителността в сравнение със стандартните Blackwell чипове. Докато един Ultra чип поддържа същите 20 petaflops AI изчисления като стандартния Blackwell, той се възползва значително от 50% увеличение на високоскоростната памет (HBM3e), увеличавайки се от 192GB на 288GB.
Разглеждайки по-големия мащаб, пълномащабен DGX GB300 ‘Superpod’ продължава да съдържа 288 CPU и 576 GPU. Тази настройка осигурява 11,5 exaflops FP4 изчисления, отразявайки производителността на оригиналния Superpod, базиран на Blackwell. Въпреки това, той разполага с 25% увеличение на общата памет, достигайки масивните 300TB. Тези подобрения на паметта подчертават фокуса на NVIDIA върху приспособяването на по-големи модели и повишаването на ефективността на AI разсъжденията, а не само върху суровата изчислителна мощност.
Вместо директни сравнения Blackwell-към-Blackwell Ultra, NVIDIA показва как най-новата й платформа се сравнява с нейните чипове H100 от 2022 г., които все още се използват широко в AI натоварвания. Компанията твърди, че Blackwell Ultra осигурява 1,5 пъти по-висока FP4 производителност на изводите от H100. Най-забележителното предимство обаче се крие в способността му да ускорява AI разсъжденията.
Например, клъстер NVL72, работещ с DeepSeek-R1 671B, изключително голям езиков модел, вече може да генерира отговори само за десет секунди. Това е драстично намаление от 90-те секунди, необходими на системата H100.
NVIDIA приписва това значително подобрение на десетократното увеличение на скоростта на обработка на токени. Blackwell Ultra може да обработва 1000 токена в секунда, значителен скок от 100-те токена в секунда на H100. Тези цифри показват, че макар Blackwell Ultra да не превъзхожда драстично непосредствения си предшественик, той предлага убедителни увеличения на ефективността, особено за организации, които все още използват архитектури от предишно поколение.
Vera Rubin Superchip: Следващото поколение AI обработка
Гледайки отвъд Blackwell Ultra, NVIDIA планира да представи суперчипа Vera Rubin в края на 2026 г. Наречен в чест на изтъкнатия астроном Вера Рубин, този чип ще включва специално проектиран CPU (Vera) и GPU (Rubin). Това представлява значителна стъпка напред в стремежа на NVIDIA към авангардни възможности за AI обработка.
Vera CPU, базиран на архитектурата Olympus на NVIDIA, се очаква да осигури двойно по-голяма производителност от настоящите Grace CPU. Rubin GPU, от друга страна, ще поддържа до впечатляващите 288GB високоскоростна памет. Този значителен капацитет на паметта ще подобри значително възможностите за обработка на данни, особено за сложни AI задачи.
Архитектурата Vera Rubin демонстрира дизайн с двоен GPU на един кристал. Този иновативен дизайн позволява забележителните 50 petaFLOPS FP4 производителност на изводите на чип, насърчавайки по-ефективна обработка и намалена латентност в AI приложенията.
Vera CPU, наследяващ Grace CPU, се състои от 88 персонализирани Arm ядра с едновременна многонишковост. Тази конфигурация води до 176 нишки на сокет. Той също така разполага с 1,8TB/s NVLink интерфейс ядро-към-ядро, значително подобрявайки скоростта на трансфер на данни между CPU и GPU компонентите.
Blackwell Ultra GB300 и Vera Rubin Superchip представляват значителен напредък спрямо предишните архитектури на чипове на NVIDIA. 1,5 пъти увеличението на GB300 в плътните FP4 изчисления спрямо B200 се превръща директно в по-ефективна обработка на AI натоварвания. Това, от своя страна, позволява по-бързо обучение и време за изводи, което е от решаващо значение за ускоряване на развитието на AI.
Vera Rubin, със своите 50 petaFLOPS FP4 производителност на чип, означава значителен скок напред. Това ниво на производителност позволява внедряването на още по-сложни AI модели и приложения, разширявайки границите на възможното в областта на изкуствения интелект.
Амбициозният график за разработка на NVIDIA, с планове за годишни издания на нови поколения AI чипове, подчертава нейната отдаденост на поддържането на водеща позиция на бързо развиващия се пазар на AI хардуер. Ангажиментът на компанията към иновациите е очевиден в непрекъснатия й стремеж към по-мощни и ефективни решения за AI обработка. Представянето на тези нови суперчипове не е просто за постепенни подобрения; става въпрос за активиране на нова ера от AI възможности.
Подобренията в капацитета на паметта и скоростта на обработка са особено забележителни. Способността да се обработват по-големи модели и набори от данни е от решаващо значение за разработването на по-сложни AI системи. Тъй като AI моделите продължават да нарастват по сложност, необходимостта от хардуер, който може да поддържа темпото, става все по-важна. Фокусът на NVIDIA върху честотната лента на паметта и скоростта на обработка на токени директно отговаря на тази нужда.
Преминаването към акцентиране върху повишаването на ефективността, особено за организации, преминаващи от по-стари архитектури, е стратегически ход от страна на NVIDIA. Той признава, че не всички потребители веднага ще приемат най-новия хардуер. Като демонстрира значителни подобрения в производителността спрямо чиповете от предишно поколение, NVIDIA предоставя убедителен аргумент за надграждане.
Суперчипът Vera Rubin, със своя специално проектиран CPU и GPU, представлява значителен архитектурен напредък. Дизайнът с двоен GPU на един кристал е иновативен подход, който обещава да осигури значителни увеличения на производителността и намалена латентност. Този дизайн отразява ангажимента на NVIDIA да разширява границите на дизайна на чипове и да максимизира производителността.
Наименуването на чипа на астронома Вера Рубин е подходяща почит към нейната новаторска работа. Той също така фино засилва ангажимента на NVIDIA към научните открития и иновациите. Фокусът на компанията върху AI се простира отвъд търговските приложения; той също така обхваща напредъка на научните изследвания.
Като цяло, обявяването от NVIDIA на суперчиповете Blackwell Ultra GB300 и Vera Rubin бележи важен етап в еволюцията на AI хардуера. Тези нови чипове са готови да ускорят разработването и внедряването на AI в широк спектър от индустрии. Ангажиментът на компанията към иновациите и нейният агресивен график за разработка предполагат, че можем да очакваме още по-новаторски постижения през следващите години. Фокусът както върху суровата производителност, така и върху повишаването на ефективността гарантира, че тези чипове ще бъдат подходящи за широк спектър от потребители, от тези с авангардни системи до тези, които все още използват по-стари архитектури. Бъдещето на AI хардуера изглежда светло и NVIDIA ясно се позиционира в челните редици на тази вълнуваща област. Увеличената памет, подобрените скорости на обработка и иновативните дизайни на тези нови суперчипове несъмнено ще проправят пътя за нови пробиви в изкуствения интелект, оказвайки влияние върху различни сектори и стимулирайки по-нататъшен напредък през следващите години.