El Amanecer de las Fábricas de IA

En el reino de la inteligencia artificial, el contexto reina de manera suprema. Este principio refleja la inteligencia humana, sugiriendo su relevancia para la IA, dada nuestra creación de ella a nuestra propia imagen y semejanza.

Actualmente, observamos compañías como NVIDIA defendiendo las fábricas de IA – esencialmente, superordenadores procesando petabytes de datos para entregar respuestas inteligentes – como un medio novedoso de catalizar cambios significativos en la economía global y las culturas.

Pero, ¿cómo llegamos a esta coyuntura? La respuesta, como siempre, reside en una serie de avances incrementales.

Antes de profundizar en los detalles de las fábricas de IA y sus implicaciones para el futuro de los negocios y la sociedad, establezcamos un contexto fundacional.

La Revolución Neolítica: Sembrando las Semillas de la Innovación

Hace aproximadamente 12,000 años, nuestros ancestros hicieron la transición de nómadas cazadores-recolectores a agricultores sedentarios, cultivando plantas y criando animales para su sustento. La agricultura, o la labranza, representa una fábrica rudimentaria de alimentos, que depende de la luz solar, el agua y el aire para el crecimiento de plantas y animales. El término ‘firma’, que denota un pago de renta fija por el cultivo de la tierra en tiempos medievales, se hizo sinónimo de agricultura.

La agricultura necesitó estructuras sociales jerárquicas para operaciones agrícolas eficientes. La escritura emergió como una herramienta administrativa, facilitando el seguimiento de los insumos y productos dentro de estas fábricas de alimentos y estableciendo reglas sociales. Con el tiempo, la escritura se expandió para abarcar diversos dominios y sigue siendo un medio potente para transmitir información compleja.

Desde el momento en que cambiamos arcos y lanzas por azadas, rastrillos y arados, e inscribimos los primeros glifos simbólicos en arcilla o piedra, el advenimiento de la IA, y consecuentemente, la fábrica de IA, se hizo inevitable. Era meramente una cuestión de tiempo.

La Revolución Industrial: Forjando el Camino hacia la Producción en Masa

Durante milenios, la humanidad perfeccionó sus habilidades agrícolas, produciendo excedentes que fomentaron el surgimiento de una clase mercantil – individuos dedicados a la fabricación de bienes para otros, o ‘manufactura’, derivado del latín ‘un trabajo hecho a mano’. Esto llevó al desarrollo del dinero, un medio de intercambio que aceleró el trueque y lo transformó en la economía moderna. La globalización interconectó economías regionales y nacionales después de la Era de la Exploración.

Ondas subsecuentes de globalización reformaron tanto la agricultura como la manufactura. Un cambio pivotal en las fábricas, los epicentros de la manufactura estandarizada, involucró la división del proceso de producción en pasos discretos para mejorar la velocidad y la repetibilidad. Esta Revolución Industrial coincidió con la Ilustración, caracterizada por tasas de alfabetización altísimas, ya que las fábricas requerían trabajadores educados para maximizar la eficiencia y minimizar el desperdicio. La educación se volvió una necesidad, fomentando el reconocimiento de la habilitación, los derechos de propiedad privada, la libertad de religión, la seguridad, el discurso y el derecho a juicios rápidos.

Estos principios, autoevidentes en el siglo XXI, deben su génesis al siglo XVIII.

Las fábricas llevaron la manufactura al interior, utilizando vapor y electricidad para impulsar líneas de ensamblaje y técnicas de manufactura esbelta. Esto permitió la producción de bienes a precios asequibles, elevando los estándares de vida y fomentando el crecimiento de una clase media, impulsando la expansión económica más allá de las capacidades de las sociedades agrícolas.

La Revolución de la IA: Los Datos como la Nueva Frontera

El advenimiento del Internet interconectó individuos y generó un nuevo recurso: datos, maduros para un análisis perspicaz.

La revolución de la IA dependió de la digitalización de vastas cantidades de texto, imágenes, video y audio, junto con poder computacional asequible para procesar estos datos. Los macrodatos, cuando se combinan con GPU masivamente paralelas y ancho de banda de memoria alto, habilitan la creación de redes neuronales que codifican nuestra comprensión del mundo, habilitando así la inteligencia artificial.

Esencialmente, los macrodatos proporcionan la materia prima para que los algoritmos de IA que se ejecutan en motores de GPU construyan redes neuronales funcionales.

Estos elementos deben converger concurrentemente. En la década de 1980, los investigadores poseían algoritmos de redes neuronales pero carecían de los recursos computacionales y los datos para implementarlos. Consecuentemente, la IA permaneció en gran medida teórica hasta que estas tres condiciones se cumplieron.

Fábricas de IA: Una Transformación Literal

El término ‘fábrica de IA’ no es una mera metáfora, sino un descriptor preciso de un superordenador de IA moderno que opera en un entorno comercial. Fundamentalmente, altera la computación corporativa y el análisis de datos – la síntesis de datos en información accionable.

La fábrica de IA es tan inevitable como la revolución agrícola, donde el esfuerzo colectivo aseguró la producción de alimentos. Los cambios sociales y culturales que resultaron de esta revolución otorgaron a la humanidad tiempo libre para la contemplación y la innovación. Ahora, las máquinas pueden acceder y procesar la totalidad del conocimiento humano, habilitando búsquedas conversacionales y la aplicación inversa de algoritmos de IA para generar nuevos datos en varios formatos.

Los negocios y los individuos tendrán acceso a fábricas de IA, ya sea directamente o a través de arreglos de tiempo compartido. Estas fábricas de IA generarán ideas novedosas, visiones y amplificarán las capacidades creativas individuales.

El potencial transformador de las fábricas de IA lo abarca todo. Los chatbots, los desarrolladores de motores de computación paralela para el entrenamiento e inferencia de modelos, y los creadores de modelos como OpenAI, Anthropic, Google y Mistral coinciden en que la IA reformará cada aspecto de nuestras vidas. A pesar de los desacuerdos globales en varios temas, el impacto transformador de la IA se reconoce universalmente.

Manufacturando Perspicacia y Acción

Las fábricas de IA sirven dos funciones primarias. La primera es entrenar modelos fundacionales, produciendo perspicacia para la mejora de negocios y personal. La segunda, y más significativa, función implica alimentar nuevos datos y preguntas en estos modelos para inferir nuevas respuestas, generar nuevos tokens e impulsar la acción.

Gran parte de la discusión que rodea a la IA se ha centrado en entrenar modelos fundacionales en constante expansión, que cuentan con cientos de miles de millones a billones de parámetros y vastos conjuntos de datos. Los conteos de tokens indican la amplitud del conocimiento, mientras que los parámetros reflejan la profundidad de la comprensión. Conteo de parámetros más pequeños emparejados con conjuntos de tokens más grandes producen respuestas más rápidas y simples. Por el contrario, conteos de parámetros más grandes y conjuntos de tokens más pequeños proporcionan perspicacias más matizadas en un dominio limitado. Los modelos de razonamiento de cadena de pensamiento, multimodales en naturaleza, combinan modelos especializados para considerar salidas que impulsan otras entradas, generando respuestas integrales.

Las fábricas de IA utilizan todo el contenido creado por la humanidad y datos sintéticos generados por modelos de IA como materia prima. Las perspicacias derivadas de estos datos son aprovechadas por humanos y agentes de IA para impulsar la acción. En lugar de trabajar en la fábrica, los individuos se conectan a ella, aumentando sus habilidades con el conocimiento y la velocidad de los modelos de IA para lograr más, mejores y más rápidos resultados.

Según Jensen Huang, cofundador y CEO de NVIDIA, ‘El mundo está corriendo para construir fábricas de IA a gran escala y de última generación’. Establecer una fábrica de IA es una hazaña de ingeniería extraordinaria, que requiere vastos recursos, mano de obra y material.

Construir una fábrica de IA implica una inversión de capital significativa. Una configuración típica comprende un NVIDIA DGX SuperPOD basado en múltiples bastidores de sistemas DGX, que cuentan con GPU, CPU, interconexiones de alta velocidad y almacenamiento.

Con numerosos sistemas DGX, un SuperPOD entrega un rendimiento sustancial, que cuenta con una capacidad de memoria y un ancho de banda considerables. El rendimiento se puede escalar añadiendo más sistemas.

Otro plano técnico de NVIDIA para una fábrica de IA se centra en la plataforma NVIDIA GB200 NVL72, un sistema a escala de bastidor que integra GPU, CPU, DPU, SuperNIC, NVLink y NVSwitch, y redes de alta velocidad. Esta plataforma ofrece un dominio de memoria GPU compartida más grande para modelos de IA y una densidad de cómputo más alta, necesitando refrigeración líquida.

El GB200 NVL72, que se envía en volumen completo, representa un sistema autónomo capaz de construir modelos y generar datos en varios formatos.

El GB200 NVL72 comprende un nodo de servidor MGX que cuenta con una CPU NVIDIA Grace emparejada con GPU Blackwell. Dos de estos nodos de servidor forman una bandeja de cómputo dentro del bastidor NVL72, con dieciocho bandejas de cómputo que albergan numerosas GPU y CPU.

El sistema a escala de bastidor GB200 NVL72 combina CPU Grace con GPU Blackwell, interconectadas a través de conexiones NVLink de alta velocidad. Los puertos NVLink y los chips NVSwitch enlazan todas las GPU en una configuración de memoria compartida, ideal para el entrenamiento de modelos fundacionales y la inferencia de cadena de pensamiento.

El tejido NVLink, facilitado por nueve bandejas de conmutación NVLink, habilita el acceso a todos los troqueles de GPU como una GPU unificada para aplicaciones de IA.

Los sistemas GB200 NVL72 cuentan con numerosos núcleos Arm para el procesamiento del host y una potencia de procesamiento de punto flotante sustancial. El sistema GB200 NVL72 cuenta con una memoria HBM3e significativa adjunta a las GPU, con un ancho de banda agregado alto. Las CPU Grace cuentan con memoria LPDDR5X, accesible a través de NVLink.

El NVIDIA GB200 NVL72 refleja el impacto transformador del System/360 en el procesamiento de transacciones en línea, siendo la diferencia clave la escalabilidad del NVL72 a través de interconexiones InfiniBand.

Las configuraciones DGX SuperPOD basadas en sistemas a escala de bastidor NVL72 requieren una potencia considerable, pero entregan una potencia de cómputo y una capacidad de memoria inmensas a través de múltiples bastidores de cómputo. El rendimiento se puede escalar añadiendo más bastidores.

La densidad de cómputo del bastidor NVL72 necesita refrigeración líquida especializada e infraestructura de centro de datos, representando un retorno a prácticas pasadas donde las máquinas refrigeradas por agua maximizaban el rendimiento.

Las fábricas de IA demandarán significativamente más potencia de cómputo a medida que la inferencia se vuelva integral para diversas aplicaciones, especialmente con el cambio hacia modelos de razonamiento de cadena de pensamiento.

Las fábricas de IA abarcan no solo hardware, sino también sistemas y software de desarrollo.

Los sistemas DGX GB200 y los superordenadores de IA DGX SuperPOD requieren administración y modelado, facilitados por herramientas como NVIDIA Mission Control, que orquesta cargas de trabajo de IA y automáticamente recupera trabajos. Mission Control monitorea la salud del sistema y optimiza el consumo de energía.

NVIDIA AI Enterprise, el conjunto de software de sistemas, incluye bibliotecas, modelos y marcos optimizados para GPU y redes NVIDIA. La pila de fábrica de IA también cuenta con NVIDIA Dynamo, un marco de código abierto para ejecutar la inferencia a través de la infraestructura NVLink y DGX SuperPOD. DGX Expert Service and Support ayuda a los clientes a implementar estas tecnologías, reduciendo el tiempo hasta el primer token. NVIDIA ofrece planos técnicos de fábrica de IA para su entorno ‘gemelo digital’ Omniverse para simular y optimizar el diseño del centro de datos.

Un aspecto crucial de las fábricas de IA es el cambio en el pensamiento que engendran, con NVIDIA priorizando el margen de maniobra para el crecimiento del sistema.

Según Gilad Shainer, vicepresidente sénior de redes en NVIDIA, ‘Generar tokens ahora equivale a generar ingresos para muchas compañías’. Los centros de datos están evolucionando de centros de costos a activos productivos.

Y eso, en última instancia, es la esencia de construir una fábrica.