NVIDIA y Microsoft: IA Agéntica

NVIDIA y Microsoft: Impulsando la Innovación en IA Agéntica desde la Nube al PC

NVIDIA y Microsoft están intensificando sus esfuerzos colaborativos para impulsar los avances en aplicaciones de IA agéntica, abarcando desde soluciones basadas en la nube hasta ordenadores personales. Esta asociación reforzada está preparada para acelerar los descubrimientos científicos y fomentar la innovación en varios sectores.

Mejora de la Investigación Científica con IA

Microsoft Discovery está programado para integrar el microservicio ALCHEMI NIM de NVIDIA. Esta integración es fundamental para optimizar la inferencia de IA para simulaciones químicas complejas, acelerando así significativamente la investigación en ciencia de materiales a través de la predicción precisa de propiedades y la recomendación efectiva de candidatos. Esta mejora promete agilizar la identificación de nuevos materiales con las características deseadas, reduciendo el tiempo y los recursos tradicionalmente necesarios.

Además, Microsoft Discovery incorporará los microservicios BioNeMo NIM de NVIDIA. Estos microservicios están diseñados para aprovechar los flujos de trabajo de IA preentrenados, acelerando sustancialmente el proceso de desarrollo de modelos de IA para el descubrimiento de fármacos. Al aprovechar estas herramientas, los investigadores pueden desarrollar y refinar rápidamente modelos de IA que predicen la eficacia del fármaco y los posibles efectos secundarios, lo que lleva a procesos de desarrollo de fármacos más eficientes y específicos.

Estas integraciones están meticulosamente diseñadas para capacitar a los investigadores con un rendimiento acelerado, reduciendo el tiempo necesario para los descubrimientos científicos. Aseguran que los investigadores puedan manejar vastos conjuntos de datos y simulaciones intrincadas con una velocidad y precisión sin precedentes, lo que les permite abordar algunos de los problemas más desafiantes en la investigación científica.

Una aplicación práctica de estos avances fue demostrada por investigadores de Microsoft. Utilizaron con éxito Microsoft Discovery para identificar un nuevo prototipo de refrigerante que exhibió propiedades prometedoras para la refrigeración por inmersión en centros de datos en menos de 200 horas. Este cronograma contrasta marcadamente con los meses o incluso años que normalmente requieren los métodos convencionales. La refrigeración por inmersión, que implica sumergir componentes electrónicos en un refrigerante líquido no conductor, se está volviendo cada vez más vital para administrar el calor generado por los sistemas de computación de alto rendimiento.

GPU NVIDIA Blackwell en Centros de Datos Azure

Para reforzar el rendimiento y la eficiencia, Microsoft está desplegando rápidamente cientos de miles de GPU NVIDIA Blackwell dentro de centros de datos Azure optimizados para IA en todo el mundo. Estas GPU están integradas en sistemas a escala de rack NVIDIA GB200 NVL72, que están diseñados para manejar las cargas de trabajo de IA más exigentes.

Varios de los clientes clave de Microsoft, incluido OpenAI, están ejecutando actualmente cargas de trabajo de producción en esta infraestructura avanzada. La utilización de GPU NVIDIA Blackwell permite a estas organizaciones ejecutar tareas complejas de IA de manera más eficiente y efectiva. Este despliegue subraya el compromiso de Microsoft de proporcionar capacidades de IA de vanguardia a sus clientes.

Las máquinas virtuales ND GB200 v6 de Azure representan un importante salto adelante en la potencia computacional. Ofrecen hasta 35 veces más rendimiento de inferencia en comparación con las VM ND H100 v5 anteriores. Las VM más antiguas, aceleradas por ocho GPU NVIDIA H100, ahora palidecen en comparación con el rendimiento mejorado que ofrece la nueva generación, lo que marca un nuevo punto de referencia para las cargas de trabajo de IA. Este nivel de mejora del rendimiento puede reducir significativamente el tiempo y el coste asociados con la ejecución de modelos de IA a gran escala.

Esta escala impresionante y alto rendimiento son compatibles con diseños de servidor personalizados, interconexiones NVIDIA NVLink de alta velocidad y redes NVIDIA Quantum InfiniBand. Estas tecnologías facilitan la escalabilidad perfecta a miles de GPU Blackwell, críticas para manejar aplicaciones de IA generativa y agéntica exigentes. La sofisticada interconectividad garantiza una comunicación de baja latencia entre las GPU, mejorando el rendimiento general del sistema.

Satya Nadella, presidente y CEO de Microsoft, y Jensen Huang, fundador y CEO de NVIDIA, enfatizaron que su colaboración está produciendo importantes ganancias de rendimiento a través de optimizaciones continuas de software en todas las arquitecturas NVIDIA en Azure. Este enfoque está diseñado para maximizar la productividad del desarrollador, reducir el coste total de propiedad y acelerar todas las cargas de trabajo, incluyendo la IA y el procesamiento de datos. En última instancia, esto conduce a una mayor eficiencia por dólar y por vatio para los clientes.

Ampliación de las Capacidades con la Integración de NIM

Basándose en la integración de NIM en Azure AI Foundry, Microsoft y NVIDIA están ampliando la plataforma con la familia NVIDIA Llama Nemotron de modelos de razonamiento abiertos y los microservicios BioNeMo NIM de NVIDIA. Estos están diseñados para ofrecer inferencia en contenedores de calidad empresarial para la toma de decisiones complejas y cargas de trabajo de IA específicas del dominio.

Los desarrolladores ahora pueden aprovechar los microservicios NIM optimizados para el razonamiento avanzado dentro de Azure AI Foundry. Estos incluyen los modelos NVIDIA Llama Nemotron Super y Nano, que proporcionan capacidades avanzadas de razonamiento de varios pasos, codificación y agéntica. Ofrecen hasta un 20% más de precisión y una inferencia cinco veces más rápida en comparación con los modelos anteriores, lo que permite a los desarrolladores crear aplicaciones de IA más sofisticadas y eficientes.

Los microservicios BioNeMo NIM, específicamente diseñados para aplicaciones de atención médica, abordan las necesidades críticas en biología digital, descubrimiento de fármacos e imágenes médicas. Permiten a los investigadores y clínicos acelerar la ciencia de las proteínas, el modelado molecular y el análisis genómico, lo que lleva a una mejor atención al paciente y a una innovación científica más rápida. Estas herramientas permiten a los profesionales de la salud tomar decisiones más informadas y desarrollar tratamientos más eficaces.

Esta integración ampliada permite a las organizaciones desplegar rápidamente agentes de IA de alto rendimiento. Al conectarse a estos modelos y a otras soluciones sanitarias especializadas, las organizaciones pueden lograr una sólida fiabilidad y una escalabilidad simplificada, satisfaciendo así las diversas necesidades de diversas industrias y aplicaciones.

IA Generativa en Ordenadores con RTX AI

La IA generativa está revolucionando el software para PC introduciendo experiencias completamente nuevas que van desde humanos digitales hasta asistentes de escritura, agentes inteligentes y herramientas creativas. Los ordenadores con NVIDIA RTX AI facilitan la experimentación con la IA generativa y mejoran el rendimiento en Windows 11, haciendo que la IA de última generación sea accesible a un público más amplio.

En Microsoft Build, NVIDIA y Microsoft presentaron una pila de inferencia de IA diseñada para simplificar el desarrollo y mejorar el rendimiento de la inferencia para ordenadores con Windows 11. Este conjunto de herramientas es fundamental para permitir una experiencia de IA perfecta en los ordenadores personales, haciendo que las herramientas de IA sean más receptivas y eficientes.

NVIDIA TensorRT ha sido rediseñado específicamente para ordenadores con RTX AI. Combina el rendimiento de TensorRT con la construcción de motores justo a tiempo en el dispositivo y un tamaño de paquete ocho veces más pequeño para una implementación perfecta de la IA en más de 100 millones de ordenadores con RTX AI. Esta optimización permite un procesamiento de IA más rápido y eficiente en los ordenadores, allanando el camino para nuevas aplicaciones y capacidades.

Anunciado en Microsoft Build, TensorRT para RTX es compatible de forma nativa con Windows ML, una nueva pila de inferencia que proporciona a los desarrolladores de aplicaciones una amplia compatibilidad de hardware y un rendimiento de última generación. TensorRT para RTX está disponible en la versión preliminar de Windows ML a partir de hoy y estará disponible como un kit de desarrollo de software independiente de NVIDIA Developer en junio. Este desarrollo simplifica el proceso para los desarrolladores que buscan integrar capacidades de IA en sus aplicaciones de Windows, asegurando que la IA sea accesible a una amplia gama de soluciones de software.

En esencia, la colaboración entre NVIDIA y Microsoft está creando un ecosistema sinérgico donde los avances en la tecnología de IA se traducen rápidamente en aplicaciones del mundo real, beneficiando a investigadores, desarrolladores y usuarios finales por igual. Esta asociación está estratégicamente posicionada para mantener su liderazgo en el campo de la inteligencia artificial en rápida evolución.

Desglose Detallado de los Avances

Tecnologías de Vanguardia

La colaboración entre NVIDIA y Microsoft aprovecha varias tecnologías de vanguardia para lograr avances en la IA agéntica. Aquí profundizamos en estos componentes clave.

  • Microservicio ALCHEMI NIM de NVIDIA: Este microservicio es una herramienta especializada optimizada para la inferencia de IA en simulaciones químicas. Su función principal es acelerar la investigación en ciencia de materiales a través de la predicción precisa de propiedades y la recomendación eficiente de candidatos. Al permitir simulaciones más rápidas y precisas, permite a los investigadores identificar materiales prometedores mucho más rápidamente de lo que permiten los métodos tradicionales.

  • Microservicios BioNeMo NIM de NVIDIA: Estos microservicios proporcionan flujos de trabajo de IA preentrenados para acelerar el desarrollo de modelos de IA para el descubrimiento de fármacos. Los investigadores pueden utilizarlos para desarrollar rápidamente modelos que predican la eficacia del fármaco y los posibles efectos secundarios, acelerando significativamente el desarrollo de nuevos fármacos.

  • GPU Blackwell de NVIDIA: Estas GPU ofrecen un mejor rendimiento y eficiencia en las cargas de trabajo de IA dentro de los centros de datos de Azure. Integradas en sistemas a escala de rack, apoyan a clientes como OpenAI en la ejecución de tareas complejas sin problemas y de manera efectiva.

  • Interconexiones NVLink de NVIDIA: Estas interconexiones de alta velocidad sirven para asegurar una comunicación de baja latencia entre las GPU, mejorando significativamente el rendimiento general del sistema. El resultado es un cómputo más rápido y una eficiencia mejorada en varias operaciones de IA.

  • Redes Quantum InfiniBand de NVIDIA: Esto apoya la escalabilidad perfecta a miles de GPU Blackwell, haciéndolo crítico para el manejo de cargas de trabajo exigentes de IA generativa y agéntica. Las capacidades de red aseguran que los modelos de IA a gran escala puedan ser implementados y administrados de manera efectiva.

  • Modelos Llama Nemotron de NVIDIA: Los modelos NVIDIA Llama Nemotron Super y Nano están diseñados para proporcionar capacidades avanzadas de razonamiento de varios pasos, codificación y agéntica. La mejora de la precisión y las velocidades de inferencia más rápidas permiten a los desarrolladores crear aplicaciones de IA más sofisticadas y eficientes.

Impacto en la Investigación Científica

La integración de las tecnologías de NVIDIA en las plataformas de Microsoft tiene profundas implicaciones para la investigación científica en múltiples disciplinas.

  • Ciencia de los Materiales: El microservicio ALCHEMI NIM de NVIDIA ayuda en la predicción precisa de propiedades y la recomendación de candidatos, permitiendo una identificación más rápida de nuevos materiales con las características deseadas.

  • Descubrimiento de Fármacos: Los microservicios BioNeMo NIM aceleran el desarrollo de modelos de IA, permitiendo a los investigadores desarrollar modelos que predicen la eficacia del fármaco y los posibles efectos secundarios.

  • Refrigeración de Centros de Datos: Microsoft utilizó Microsoft Discovery para detectar un nuevo prototipo de refrigerante ideal para la refrigeración por inmersión en centros de datos en menos de 200 horas en lugar de meses o años con los métodos tradicionales. Esto destaca la rápida aceleración de los descubrimientos científicos.

  • Ciencia de las Proteínas, Modelado Molecular y Análisis Genómico: Los microservicios BioNeMo NIM permiten la aceleración en estos dominios. Conducen a una mejor atención al paciente y a una innovación científica más rápida.

Infraestructura de IA de Azure

Azure AI Foundry de Microsoft y sus centros de datos representan importantes inversiones en la creación de un entorno óptimo para la ejecución de cargas de trabajo de IA.

  • Máquinas Virtuales ND GB200 v6: Ofrecen hasta 35 veces más rendimiento de inferencia en comparación con las VM ND H100 v5 anteriores, estableciendo un nuevo punto de referencia para las cargas de trabajo de IA.

  • Diseños de Servidor Personalizados: Los diseños de servidor personalizados se desarrollan para maximizar el rendimiento y la eficiencia, permitiendo que las GPU Blackwell operen a su máximo potencial.

  • Optimizaciones de NVIDIA en Azure: Las optimizaciones continuas de software en todas las arquitecturas NVIDIA en Azure maximizan la productividad del desarrollador, reducen el coste total de propiedad y aceleran todas las cargas de trabajo, mejorando la eficiencia por dólar y por vatio para los clientes.

IA Generativa en Ordenadores Personales

Los avances en la tecnología de IA también están llegando a los ordenadores personales, impulsando nuevas posibilidades para las aplicaciones de software y las experiencias de usuario.

  • Ordenadores RTX AI de NVIDIA: La experimentación simplificada con IA generativa y la mejora del rendimiento en Windows 11 son facilitadas por los ordenadores RTX AI de NVIDIA. Hacen que la tecnología de IA de última generación sea más accesible a un público más amplio.

  • NVIDIA TensorRT: Este kit de desarrollo de software (SDK) ha sido optimizado para ordenadores RTX AI. Combina un alto rendimiento con un tamaño de paquete ocho veces más pequeño para una implementación perfecta de la IA. Esto facilita a los desarrolladores la integración de funciones de IA en la aplicación.

  • Soporte de Windows ML: El soporte nativo para TensorRT en Windows ML asegura una amplia compatibilidad de hardware y un rendimiento de última generación. Esto facilita la integración perfecta de la IA en las aplicaciones de Windows.

  • Nuevas Experiencias de Usuario: Desde humanos digitales hasta asistentes de escritura, agentes inteligentes y herramientas creativas, la IA generativa está remodelando el software de PC e introduciendo experiencias completamente nuevas. Los usuarios pueden beneficiarse de aplicaciones más interactivas, inteligentes y creativas.

La Visión Estratégica

La colaboración entre NVIDIA y Microsoft se asienta sobre una visión estratégica, que tiene como objetivo liderar el avance de la tecnología de IA en varios sectores. Los esfuerzos de colaboración y las tecnologías están diseñados para acelerar la adopción de la IA en diferentes dominios, beneficiando no solo a investigadores y desarrolladores, sino también a usuarios finales y organizaciones de todo el mundo.

  • Innovación: El énfasis continuo en la innovación y la colaboración acelera los avances tecnológicos. Esto ayuda a mantener el liderazgo en un campo en rápida evolución.

  • Accesibilidad: NVIDIA y Microsoft están democratizando la IA haciéndola accesible a los desarrolladores y usuarios a través de herramientas optimizadas, la integración con plataformas populares y las mejoras en la rentabilidad.

  • Rendimiento y Eficiencia: El enfoque en la mejora tanto del rendimiento como de la rentabilidad asegura que los beneficios de las tecnologías de IA estén disponibles para una amplia gama de usuarios, desde investigadores individuales hasta grandes empresas.

  • Aplicaciones del Mundo Real: Al traducir los avances de la IA en soluciones del mundo real, NVIDIA y Microsoft están impulsando beneficios tangibles y transformando industrias en todo el mundo.