Blackwell Ultra GB300: Скачок в производительности
Ожидается, что Blackwell Ultra GB300, поставки которого начнутся во второй половине 2025 года, станет значительным шагом вперед по сравнению с предыдущими предложениями NVIDIA. Этот новый суперчип разработан для обеспечения повышенной вычислительной мощности и увеличенной пропускной способности памяти, что крайне важно для удовлетворения постоянно растущих потребностей современных приложений искусственного интеллекта (AI).
Система GB300 — это мощный центр, объединяющий 72 GPU NVIDIA Blackwell Ultra и 36 CPU NVIDIA Grace на базе Arm. Эта комбинация обеспечивает впечатляющую производительность FP4 AI в 1400 петафлопс. Для сравнения, это в 1,5 раза больше, чем у его предшественника, Blackwell B200, по плотности вычислений FP4.
Одним из наиболее значительных обновлений в GB300 является объем памяти. Каждый GPU в системе оснащен ошеломляющими 288 ГБ памяти HBM3e. Это составляет более 20 ТБ памяти GPU на систему. Такое существенное увеличение объема памяти позволяет обрабатывать гораздо большие модели ИИ и наборы данных, обеспечивая более сложные вычисления и более высокую скорость обработки.
NVIDIA позиционирует платформу Blackwell Ultra AI Factory как предлагающую постепенный, а не революционный прирост производительности по сравнению со стандартными чипами Blackwell. Хотя один чип Ultra сохраняет те же 20 петафлопс AI-вычислений, что и стандартный Blackwell, он значительно выигрывает от 50%-го увеличения объема высокоскоростной памяти (HBM3e) с 192 ГБ до 288 ГБ.
Рассматривая более крупный масштаб, полномасштабный DGX GB300 ‘Superpod’ по-прежнему содержит 288 CPU и 576 GPU. Эта установка обеспечивает 11,5 экзафлопс вычислений FP4, что соответствует производительности оригинального Superpod на базе Blackwell. Однако он отличается увеличенным на 25% общим объемом памяти, который теперь достигает колоссальных 300 ТБ. Эти улучшения памяти подчеркивают внимание NVIDIA к размещению более крупных моделей и повышению эффективности AI-рассуждений, а не только к увеличению вычислительной мощности.
Вместо прямых сравнений Blackwell с Blackwell Ultra, NVIDIA демонстрирует, как ее новейшая платформа соотносится с чипами H100 2022 года выпуска, которые все еще широко используются в AI-нагрузках. Компания утверждает, что Blackwell Ultra обеспечивает в 1,5 раза большую производительность вывода FP4, чем H100. Однако самое замечательное преимущество заключается в его способности ускорять AI-рассуждения.
Например, кластер NVL72, работающий с DeepSeek-R1 671B, исключительно большой языковой моделью, теперь может генерировать ответы всего за десять секунд. Это значительное сокращение по сравнению с 90 секундами, необходимыми для системы H100.
NVIDIA объясняет это существенное улучшение десятикратным увеличением скорости обработки токенов. Blackwell Ultra может обрабатывать 1000 токенов в секунду, что является значительным скачком по сравнению со 100 токенами в секунду у H100. Эти цифры показывают, что, хотя Blackwell Ultra, возможно, и не превосходит своего непосредственного предшественника кардинально, он предлагает убедительные преимущества в эффективности, особенно для организаций, все еще использующих архитектуры предыдущего поколения.
Суперчип Vera Rubin: Следующее поколение AI-обработки
Заглядывая за пределы Blackwell Ultra, NVIDIA планирует представить суперчип Vera Rubin в конце 2026 года. Названный в честь выдающегося астронома Веры Рубин, этот чип будет включать в себя специально разработанный CPU (Vera) и GPU (Rubin). Это представляет собой значительный шаг вперед в стремлении NVIDIA к передовым возможностям AI-обработки.
CPU Vera, основанный на архитектуре NVIDIA Olympus, по прогнозам, обеспечит вдвое большую производительность, чем текущие CPU Grace. GPU Rubin, с другой стороны, будет поддерживать до впечатляющих 288 ГБ высокоскоростной памяти. Эта значительная емкость памяти значительно улучшит возможности обработки данных, особенно для сложных AI-задач.
Архитектура Vera Rubin демонстрирует дизайн с двумя GPU на одном кристалле. Этот инновационный дизайн обеспечивает замечательную производительность вывода FP4 в 50 петафлопс на чип, способствуя более эффективной обработке и снижению задержек в AI-приложениях.
CPU Vera, преемник CPU Grace, состоит из 88 пользовательских ядер Arm с одновременной многопоточностью. Эта конфигурация дает 176 потоков на сокет. Он также оснащен интерфейсом NVLink «ядро-ядро» со скоростью 1,8 ТБ/с, что значительно повышает скорость передачи данных между компонентами CPU и GPU.
Blackwell Ultra GB300 и суперчип Vera Rubin представляют собой существенные достижения по сравнению с предыдущими архитектурами чипов NVIDIA. Увеличение плотности вычислений FP4 в GB300 в 1,5 раза по сравнению с B200 напрямую приводит к более эффективной обработке AI-нагрузок. Это, в свою очередь, обеспечивает более быстрое обучение и время вывода, что крайне важно для ускорения разработки ИИ.
Vera Rubin с его производительностью FP4 в 50 петафлопс на чип означает значительный скачок вперед. Этот уровень производительности позволяет развертывать еще более сложные AI-модели и приложения, раздвигая границы возможного в области искусственного интеллекта.
Амбициозный график разработки NVIDIA, с планами ежегодного выпуска новых поколений AI-чипов, подчеркивает ее стремление сохранить лидирующие позиции на быстро развивающемся рынке AI-оборудования. Приверженность компании инновациям очевидна в ее постоянном поиске более мощных и эффективных решений для AI-обработки. Внедрение этих новых суперчипов — это не просто постепенные улучшения; речь идет о создании новой эры возможностей ИИ.
Особенно примечательны достижения в области емкости памяти и скорости обработки. Возможность обрабатывать более крупные модели и наборы данных имеет решающее значение для разработки более сложных AI-систем. Поскольку AI-модели продолжают усложняться, потребность в оборудовании, которое может идти в ногу со временем, становится все более важной. Акцент NVIDIA на пропускной способности памяти и скорости обработки токенов напрямую отвечает этой потребности.
Переход к акценту на повышении эффективности, особенно для организаций, переходящих со старых архитектур, является стратегическим шагом NVIDIA. Он признает, что не все пользователи сразу же перейдут на новейшее оборудование. Демонстрируя значительные улучшения производительности по сравнению с чипами предыдущего поколения, NVIDIA предоставляет убедительный аргумент в пользу обновления.
Суперчип Vera Rubin со специально разработанным CPU и GPU представляет собой значительный архитектурный прогресс. Дизайн с двумя GPU на одном кристалле — это инновационный подход, который обещает обеспечить существенный прирост производительности и снижение задержек. Этот дизайн отражает стремление NVIDIA раздвигать границы дизайна чипов и максимизировать производительность.
Название чипа в честь астронома Веры Рубин является достойной данью ее новаторской работе. Оно также тонко подчеркивает приверженность NVIDIA научным открытиям и инновациям. Внимание компании к ИИ выходит за рамки коммерческих приложений; оно также охватывает развитие научных исследований.
В целом, анонс NVIDIA суперчипов Blackwell Ultra GB300 и Vera Rubin знаменует собой важную веху в эволюции AI-оборудования. Эти новые чипы призваны ускорить разработку и внедрение ИИ в широком спектре отраслей. Приверженность компании инновациям и ее агрессивный график разработки позволяют предположить, что в ближайшие годы нас ждут еще более революционные достижения. Акцент как на чистой производительности, так и на повышении эффективности гарантирует, что эти чипы будут актуальны для широкого круга пользователей, от тех, кто использует передовые системы, до тех, кто все еще использует старые архитектуры. Будущее AI-оборудования выглядит многообещающим, и NVIDIA явно позиционирует себя в авангарде этой захватывающей области. Увеличенный объем памяти, повышенная скорость обработки и инновационный дизайн этих новых суперчипов, несомненно, проложат путь к новым прорывам в области искусственного интеллекта, оказывая влияние на различные сектора и способствуя дальнейшему прогрессу в ближайшие годы.