Nuevos Superchips: Blackwell y Rubin

Blackwell Ultra GB300: Un Salto en Rendimiento

Se espera que el Blackwell Ultra GB300, que se lanzará en la segunda mitad de 2025, represente un avance considerable con respecto a las ofertas anteriores de NVIDIA. Este nuevo superchip está diseñado para proporcionar una mayor potencia de computación y un mayor ancho de banda de memoria, crucial para satisfacer las crecientes demandas de las aplicaciones modernas de IA.

El sistema GB300 es una potencia, integrando 72 GPUs NVIDIA Blackwell Ultra y 36 CPUs NVIDIA Grace basadas en Arm. Esta combinación ofrece unos impresionantes 1,400 petaFLOPS de rendimiento FP4 AI. Para ponerlo en perspectiva, eso es un aumento de 1.5 veces en la capacidad de cómputo FP4 denso en comparación con su predecesor, el Blackwell B200.

Una de las actualizaciones más significativas en el GB300 es su capacidad de memoria. Cada GPU dentro del sistema está equipada con la asombrosa cantidad de 288 GB de memoria HBM3e. Esto equivale a un total de más de 20 TB de memoria de GPU por sistema. Este aumento sustancial de la memoria permite el procesamiento de modelos de IA y conjuntos de datos mucho más grandes, lo que permite cálculos más complejos y logra velocidades de procesamiento más rápidas.

NVIDIA está posicionando la Blackwell Ultra AI Factory Platform como una plataforma que ofrece ganancias de rendimiento incrementales, en lugar de revolucionarias, en comparación con los chips Blackwell estándar. Si bien un solo chip Ultra mantiene los mismos 20 petaflops de cómputo de IA que el Blackwell estándar, se beneficia significativamente de un aumento del 50% en la memoria de alto ancho de banda (HBM3e), aumentando de 192 GB a 288 GB.

Examinando la escala más grande, un ‘Superpod’ DGX GB300 a gran escala continúa albergando 288 CPUs y 576 GPUs. Esta configuración ofrece 11.5 exaflops de computación FP4, lo que refleja el rendimiento del Superpod original basado en Blackwell. Sin embargo, presenta un aumento del 25% en la memoria total, que ahora alcanza la enorme cifra de 300 TB. Estas mejoras de memoria resaltan el enfoque de NVIDIA en acomodar modelos más grandes y mejorar la eficiencia del razonamiento de la IA, en lugar de centrarse únicamente en la potencia computacional bruta.

En lugar de comparaciones directas de Blackwell a Blackwell Ultra, NVIDIA está mostrando cómo su plataforma más reciente se compara con sus chips H100 de la era de 2022, que todavía se utilizan ampliamente en cargas de trabajo de IA. La compañía afirma que Blackwell Ultra proporciona 1.5 veces el rendimiento de inferencia FP4 del H100. Sin embargo, la ventaja más notable radica en su capacidad para acelerar el razonamiento de la IA.

Por ejemplo, un clúster NVL72 que ejecuta DeepSeek-R1 671B, un modelo de lenguaje excepcionalmente grande, ahora puede generar respuestas en solo diez segundos. Esta es una reducción drástica de los 90 segundos requeridos en el sistema H100.

NVIDIA atribuye esta mejora sustancial a un aumento de diez veces en la velocidad de procesamiento de tokens. El Blackwell Ultra puede manejar 1,000 tokens por segundo, un salto significativo de los 100 tokens por segundo del H100. Estas cifras demuestran que, si bien el Blackwell Ultra puede no superar drásticamente a su predecesor inmediato, ofrece ganancias de eficiencia convincentes, especialmente para las organizaciones que aún utilizan arquitecturas de generaciones anteriores.

Vera Rubin Superchip: La Próxima Generación de Procesamiento de IA

Mirando más allá del Blackwell Ultra, NVIDIA tiene planes de presentar el superchip Vera Rubin a finales de 2026. Nombrado en honor a la distinguida astrónoma Vera Rubin, este chip incorporará una CPU (Vera) y una GPU (Rubin) de diseño personalizado. Esto representa un importante paso adelante en la búsqueda de NVIDIA de capacidades de procesamiento de IA de vanguardia.

Se proyecta que la CPU Vera, basada en la arquitectura Olympus de NVIDIA, ofrecerá el doble de rendimiento que las CPU Grace actuales. La GPU Rubin, por otro lado, admitirá hasta la impresionante cantidad de 288 GB de memoria de alto ancho de banda. Esta sustancial capacidad de memoria mejorará significativamente las capacidades de procesamiento de datos, particularmente para tareas complejas de IA.

La arquitectura Vera Rubin presenta un diseño de doble GPU en un solo dado. Este diseño innovador permite un notable rendimiento de inferencia FP4 de 50 petaFLOPS por chip, fomentando un procesamiento más eficiente y una latencia reducida en las aplicaciones de IA.

La CPU Vera, sucesora de la CPU Grace, consta de 88 núcleos Arm personalizados con multihilo simultáneo. Esta configuración da como resultado 176 hilos por socket. También cuenta con una interfaz NVLink núcleo a núcleo de 1.8 TB/s, lo que mejora significativamente las velocidades de transferencia de datos entre los componentes de la CPU y la GPU.

El Blackwell Ultra GB300 y el Superchip Vera Rubin representan avances sustanciales con respecto a las arquitecturas de chips anteriores de NVIDIA. El aumento de 1.5 veces en el cómputo FP4 denso del GB300 sobre el B200 se traduce directamente en un procesamiento más eficiente de las cargas de trabajo de IA. Esto, a su vez, permite tiempos de entrenamiento e inferencia más rápidos, cruciales para acelerar el desarrollo de la IA.

El Vera Rubin, con sus 50 petaFLOPS de rendimiento FP4 por chip, significa un salto considerable hacia adelante. Este nivel de rendimiento permite la implementación de modelos y aplicaciones de IA aún más sofisticados, superando los límites de lo que es posible en el campo de la inteligencia artificial.

El ambicioso cronograma de desarrollo de NVIDIA, con planes para lanzamientos anuales de nuevas generaciones de chips de IA, subraya su dedicación a mantener una posición de liderazgo en el mercado de hardware de IA en rápida evolución. El compromiso de la compañía con la innovación es evidente en su continua búsqueda de soluciones de procesamiento de IA más potentes y eficientes. La introducción de estos nuevos superchips no se trata solo de mejoras incrementales; se trata de habilitar una nueva era de capacidades de IA.

Los avances en la capacidad de memoria y la velocidad de procesamiento son particularmente notables. La capacidad de manejar modelos y conjuntos de datos más grandes es crucial para el desarrollo de sistemas de IA más sofisticados. A medida que los modelos de IA continúan creciendo en complejidad, la necesidad de hardware que pueda seguir el ritmo se vuelve cada vez más importante. El enfoque de NVIDIA en el ancho de banda de la memoria y la velocidad de procesamiento de tokens aborda directamente esta necesidad.

El cambio hacia el énfasis en las ganancias de eficiencia, particularmente para las organizaciones que hacen la transición desde arquitecturas más antiguas, es un movimiento estratégico de NVIDIA. Reconoce que no todos los usuarios adoptarán inmediatamente el hardware más reciente. Al demostrar mejoras significativas en el rendimiento con respecto a los chips de la generación anterior, NVIDIA ofrece un argumento convincente para la actualización.

El superchip Vera Rubin, con su CPU y GPU de diseño personalizado, representa un avance arquitectónico significativo. El diseño de doble GPU en un solo dado es un enfoque innovador que promete ofrecer ganancias sustanciales de rendimiento y latencia reducida. Este diseño refleja el compromiso de NVIDIA de superar los límites del diseño de chips y maximizar el rendimiento.

El nombre del chip en honor a la astrónoma Vera Rubin es un tributo apropiado a su trabajo innovador. También refuerza sutilmente el compromiso de NVIDIA con el descubrimiento científico y la innovación. El enfoque de la compañía en la IA se extiende más allá de las aplicaciones comerciales; también abarca el avance de la investigación científica.

En general, el anuncio de NVIDIA de los superchips Blackwell Ultra GB300 y Vera Rubin marca un hito significativo en la evolución del hardware de IA. Estos nuevos chips están preparados para acelerar el desarrollo y la implementación de la IA en una amplia gama de industrias. El compromiso de la compañía con la innovación y su agresivo cronograma de desarrollo sugieren que podemos esperar avances aún más innovadores en los próximos años. El enfoque tanto en el rendimiento bruto como en las ganancias de eficiencia garantiza que estos chips serán relevantes para un amplio espectro de usuarios, desde aquellos con sistemas de vanguardia hasta aquellos que aún utilizan arquitecturas más antiguas. El futuro del hardware de IA parece brillante, y NVIDIA se está posicionando claramente a la vanguardia de este emocionante campo. El aumento de la memoria, las velocidades de procesamiento mejoradas y los diseños innovadores de estos nuevos superchips sin duda allanarán el camino para nuevos avances en inteligencia artificial, impactando varios sectores e impulsando nuevos avances en los próximos años.