Blackwell Ultra GB300: Um Salto em Desempenho
Previsto para ser lançado no segundo semestre de 2025, o Blackwell Ultra GB300 representa um avanço considerável em relação às ofertas anteriores da NVIDIA. Este novo superchip foi projetado para fornecer maior poder de computação e maior largura de banda de memória, cruciais para atender às crescentes demandas das aplicações modernas de inteligência artificial (AI).
O sistema GB300 é uma potência, integrando 72 GPUs NVIDIA Blackwell Ultra e 36 CPUs NVIDIA Grace baseadas em Arm. Essa combinação oferece impressionantes 1.400 petaFLOPS de desempenho FP4 AI. Para colocar isso em perspectiva, é um aumento de 1,5 vezes na capacidade de computação FP4 densa em comparação com seu antecessor, o Blackwell B200.
Uma das atualizações mais significativas no GB300 é sua capacidade de memória. Cada GPU dentro do sistema é equipada com impressionantes 288 GB de memória HBM3e. Isso equivale a um total de mais de 20 TB de memória GPU por sistema. Esse aumento substancial na memória permite o processamento de modelos e conjuntos de dados de AI muito maiores, permitindo cálculos mais complexos e alcançando velocidades de processamento mais rápidas.
A NVIDIA está posicionando a Blackwell Ultra AI Factory Platform como oferecendo ganhos de desempenho incrementais, em vez de revolucionários, em comparação com os chips Blackwell padrão. Embora um único chip Ultra mantenha os mesmos 20 petaflops de computação de AI que o Blackwell padrão, ele se beneficia significativamente de um aumento de 50% na memória de alta largura de banda (HBM3e), aumentando de 192 GB para 288 GB.
Examinando a escala maior, um ‘Superpod’ DGX GB300 em grande escala continua a abrigar 288 CPUs e 576 GPUs. Essa configuração oferece 11,5 exaflops de computação FP4, espelhando o desempenho do Superpod original baseado em Blackwell. No entanto, ele apresenta um aumento de 25% na memória total, agora atingindo 300 TB massivos. Esses aprimoramentos de memória destacam o foco da NVIDIA em acomodar modelos maiores e aumentar a eficiência do raciocínio de AI, em vez de se concentrar apenas no poder computacional bruto.
Em vez de comparações diretas de Blackwell para Blackwell Ultra, a NVIDIA está mostrando como sua mais nova plataforma se compara aos seus chips H100 da era de 2022, que ainda são amplamente utilizados em cargas de trabalho de AI. A empresa afirma que o Blackwell Ultra oferece 1,5 vezes o desempenho de inferência FP4 do H100. No entanto, a vantagem mais notável reside em sua capacidade de acelerar o raciocínio de AI.
Por exemplo, um cluster NVL72 executando DeepSeek-R1 671B, um modelo de linguagem excepcionalmente grande, agora pode gerar respostas em meros dez segundos. Esta é uma redução drástica dos 90 segundos necessários no sistema H100.
A NVIDIA credita essa melhoria substancial a um aumento de dez vezes na velocidade de processamento de tokens. O Blackwell Ultra pode lidar com 1.000 tokens por segundo, um salto significativo dos 100 tokens por segundo do H100. Esses números demonstram que, embora o Blackwell Ultra possa não superar drasticamente seu antecessor imediato, ele oferece ganhos de eficiência convincentes, especialmente para organizações que ainda utilizam arquiteturas de geração anterior.
Vera Rubin Superchip: A Próxima Geração de Processamento de AI
Olhando além do Blackwell Ultra, a NVIDIA planeja introduzir o superchip Vera Rubin no final de 2026. Nomeado em homenagem à distinta astrônoma Vera Rubin, este chip incorporará uma CPU (Vera) e GPU (Rubin) projetadas sob medida. Isso representa um passo significativo na busca da NVIDIA por capacidades de processamento de AI de ponta.
A CPU Vera, baseada na arquitetura Olympus da NVIDIA, está projetada para oferecer o dobro do desempenho das CPUs Grace atuais. A GPU Rubin, por outro lado, suportará até impressionantes 288 GB de memória de alta largura de banda. Essa capacidade de memória substancial aumentará significativamente os recursos de processamento de dados, principalmente para tarefas complexas de AI.
A arquitetura Vera Rubin apresenta um design de GPU dupla em um único chip. Este design inovador permite um notável desempenho de inferência FP4 de 50 petaFLOPS por chip, promovendo um processamento mais eficiente e latência reduzida em aplicações de AI.
A CPU Vera, sucedendo a CPU Grace, consiste em 88 núcleos Arm personalizados com multithreading simultâneo. Essa configuração resulta em 176 threads por soquete. Ele também apresenta uma interface NVLink core-to-core de 1,8 TB/s, melhorando significativamente as velocidades de transferência de dados entre os componentes da CPU e da GPU.
O Blackwell Ultra GB300 e o Vera Rubin Superchip representam avanços substanciais em relação às arquiteturas de chip anteriores da NVIDIA. O aumento de 1,5 vezes do GB300 na computação FP4 densa em relação ao B200 se traduz diretamente em um processamento mais eficiente das cargas de trabalho de AI. Isso, por sua vez, permite tempos de treinamento e inferência mais rápidos, cruciais para acelerar o desenvolvimento de AI.
O Vera Rubin, com seus 50 petaFLOPS de desempenho FP4 por chip, significa um salto considerável. Esse nível de desempenho permite a implantação de modelos e aplicações de AI ainda mais sofisticados, ultrapassando os limites do que é possível no campo da inteligência artificial.
O cronograma de desenvolvimento ambicioso da NVIDIA, com planos para lançamentos anuais de novas gerações de chips de AI, ressalta sua dedicação em manter uma posição de liderança no mercado de hardware de AI em rápida evolução. O compromisso da empresa com a inovação é evidente em sua busca contínua por soluções de processamento de AI mais poderosas e eficientes. A introdução desses novos superchips não se trata apenas de melhorias incrementais; trata-se de permitir uma nova era de capacidades de AI.
Os avanços na capacidade de memória e na velocidade de processamento são particularmente notáveis. A capacidade de lidar com modelos e conjuntos de dados maiores é crucial para o desenvolvimento de sistemas de AI mais sofisticados. À medida que os modelos de AI continuam a crescer em complexidade, a necessidade de hardware que possa acompanhar o ritmo torna-se cada vez mais importante. O foco da NVIDIA na largura de banda da memória e na velocidade de processamento de tokens aborda diretamente essa necessidade.
A mudança para enfatizar os ganhos de eficiência, principalmente para organizações que estão em transição de arquiteturas mais antigas, é um movimento estratégico da NVIDIA. Reconhece que nem todos os usuários adotarão imediatamente o hardware mais recente. Ao demonstrar melhorias significativas de desempenho em relação aos chips de geração anterior, a NVIDIA fornece um argumento convincente para a atualização.
O superchip Vera Rubin, com sua CPU e GPU projetadas sob medida, representa um avanço arquitetônico significativo. O design de GPU dupla em um único chip é uma abordagem inovadora que promete oferecer ganhos substanciais de desempenho e latência reduzida. Este design reflete o compromisso da NVIDIA em ultrapassar os limites do design de chips e maximizar o desempenho.
A nomeação do chip em homenagem à astrônoma Vera Rubin é uma homenagem adequada ao seu trabalho inovador. Também reforça sutilmente o compromisso da NVIDIA com a descoberta científica e a inovação. O foco da empresa em AI se estende além das aplicações comerciais; também abrange o avanço da pesquisa científica.
No geral, o anúncio da NVIDIA dos superchips Blackwell Ultra GB300 e Vera Rubin marca um marco significativo na evolução do hardware de AI. Esses novos chips estão prontos para acelerar o desenvolvimento e a implantação de AI em uma ampla gama de indústrias. O compromisso da empresa com a inovação e seu cronograma de desenvolvimento agressivo sugerem que podemos esperar avanços ainda mais inovadores nos próximos anos. O foco nos ganhos de desempenho bruto e eficiência garante que esses chips serão relevantes para um amplo espectro de usuários, desde aqueles com sistemas de ponta até aqueles que ainda utilizam arquiteturas mais antigas. O futuro do hardware de AI parece brilhante, e a NVIDIA está claramente se posicionando na vanguarda deste campo emocionante. O aumento da memória, as velocidades de processamento aprimoradas e os designs inovadores desses novos superchips, sem dúvida, abrirão caminho para novos avanços em inteligência artificial, impactando vários setores e impulsionando novos avanços nos próximos anos.