NVIDIA e Microsoft: IA Agente da Nuvem ao PC | pt

A NVIDIA e a Microsoft estão intensificando seus esforços colaborativos para impulsionar os avanços em aplicações de IA agente, abrangendo desde soluções baseadas na nuvem até computadores pessoais. Esta parceria aprofundada está a caminho de acelerar descobertas científicas e fomentar a inovação em diversos setores.

Aprimoramento da Pesquisa Científica com IA

O Microsoft Discovery está definido para integrar o microserviço ALCHEMI NIM da NVIDIA. Esta integração é crucial para otimizar a inferência de IA para simulações químicas complexas, acelerando significativamente a pesquisa em ciência dos materiais através da previsão precisa de propriedades e recomendação efetiva de candidatos. Este aprimoramento promete otimizar a identificação de novos materiais com características desejadas, reduzindo o tempo e os recursos tradicionalmente exigidos.

Além disso, o Microsoft Discovery incorporará os microserviços BioNeMo NIM da NVIDIA. Estes microserviços são projetados para aproveitar fluxos de trabalho de IA pré-treinados, acelerando substancialmente o processo de desenvolvimento de modelos de IA para a descoberta de fármacos. Ao aproveitar estas ferramentas, os pesquisadores podem desenvolver e refinar rapidamente modelos de IA que preveem a eficácia dos fármacos e os potenciais efeitos secundários, conduzindo a processos de desenvolvimento de fármacos mais eficientes e direcionados.

Estas integrações são meticulosamente projetadas para capacitar os pesquisadores com desempenho acelerado, reduzindo o tempo necessário para descobertas científicas. Garantem que os pesquisadores podem lidar com vastos conjuntos de dados e simulações intrincadas com velocidade e precisão sem precedentes, permitindo-lhes enfrentar alguns dos problemas mais desafiantes na pesquisa científica.

Uma aplicação prática destes avanços foi demonstrada por pesquisadores da Microsoft. Utilizaram com sucesso o Microsoft Discovery para identificar um novo protótipo de refrigerante que exibiu propriedades promissoras para o arrefecimento por imersão em centros de dados em menos de 200 horas. Este cronograma é um forte contraste com os meses ou até anos normalmente exigidos pelos métodos convencionais. O arrefecimento por imersão, que envolve a submersão de componentes eletrónicos num líquido refrigerante não condutor, está a tornar-se cada vez mais vital para gerir o calor gerado por sistemas de computação de alto desempenho.

GPUs NVIDIA Blackwell em Centros de Dados Azure

Para impulsionar o desempenho e a eficiência, a Microsoft está a implantar rapidamente centenas de milhares de GPUs NVIDIA Blackwell dentro de centros de dados Azure otimizados para IA em todo o mundo. Estas GPUs estão integradas em sistemas de escala de rack NVIDIA GB200 NVL72, que são projetados para lidar com as cargas de trabalho de IA mais exigentes.

Vários dos principais clientes da Microsoft, incluindo a OpenAI, estão atualmente a executar cargas de trabalho de produção nesta infraestrutura avançada. A utilização de GPUs NVIDIA Blackwell permite que estas organizações executem tarefas complexas de IA de forma mais eficiente e eficaz. Esta implantação sublinha o compromisso da Microsoft em fornecer capacidades de IA de ponta aos seus clientes.

As máquinas virtuais ND GB200 v6 do Azure representam um significativo salto em frente na potência computacional. Fornecem até 35 vezes mais throughput de inferência em comparação com as VMs ND H100 v5 anteriores. As VMs mais antigas, aceleradas por oito GPUs NVIDIA H100, agora em comparação com o desempenho aprimorado oferecido pela nova geração, marcando uma nova referência para cargas de trabalho de IA. Este nível de melhoria de desempenho pode reduzir significativamente o tempo e o custo associados à execução de modelos de IA em larga escala.

Esta escala impressionante e alto desempenho são suportados por designs de servidor personalizados, interconexões NVIDIA NVLink de alta velocidade e rede NVIDIA Quantum InfiniBand. Estas tecnologias facilitam o dimensionamento perfeito para milhares de GPUs Blackwell, cruciais para lidar com aplicações generativas e de IA agente exigentes. A interconectividade sofisticada garante comunicação de baixa latência entre as GPUs, melhorando o desempenho geral do sistema.

Satya Nadella, presidente e CEO da Microsoft, e Jensen Huang, fundador e CEO da NVIDIA, enfatizaram que sua colaboração está produzindo ganhos de desempenho significativos através de otimizações contínuas de software em todas as arquiteturas NVIDIA no Azure. Esta abordagem é projetada para maximizar a produtividade do desenvolvedor, reduzir o custo total de propriedade e acelerar todas as cargas de trabalho, incluindo IA e processamento de dados. Em última análise, isso leva a maior eficiência por dólar e por watt para os clientes.

Expansão das Capacidades com a Integração NIM

Com base na integração NIM no Azure AI Foundry, a Microsoft e a NVIDIA estão expandindo a plataforma com a família NVIDIA Llama Nemotron de modelos de raciocínio aberto e os microserviços BioNeMo NIM da NVIDIA. Estes são projetados para fornecer inferência em contêiner de nível empresarial para tomada de decisão complexa e cargas de trabalho de IA específicas de domínio.

Os desenvolvedores agora podem aproveitar os microserviços NIM otimizados para raciocínio avançado dentro do Azure AI Foundry. Estes incluem os modelos NVIDIA Llama Nemotron Super e Nano, que fornecem raciocínio multi-etapa avançado, codificação e capacidades de agente. Eles oferecem até 20% maior precisão e cinco vezes mais rápida inferência em comparação com os modelos anteriores, permitindo que os desenvolvedores criem aplicações de IA mais sofisticadas e eficientes.

Os microserviços BioNeMo NIM, especificamente adaptados para aplicações de saúde, abordam necessidades críticas em biologia digital, descoberta de fármacos e imagens médicas. Eles permitem que pesquisadores e médicos acelerem a ciência de proteínas, modelagem molecular e análise genômica, levando a melhores cuidados com o paciente e inovação científica mais rápida. Estas ferramentas capacitam os profissionais de saúde a tomar decisões mais informadas e desenvolver tratamentos mais eficazes.

Esta integração expandida permite que as organizações implantem rapidamente agentes de IA de alto desempenho. Ao se conectar a estes modelos e outras soluções de saúde especializadas, as organizações podem alcançar robusta confiabilidade e dimensionamento simplificado, atendendo assim às diversas necessidades de vários setores e aplicações.

IA Generativa em PCs RTX AI

A IA generativa está a revolucionar o software de PC, introduzindo experiências totalmente novas que vão desde humanos digitais a assistentes de escrita, agentes inteligentes e ferramentas criativas. Os PCs NVIDIA RTX AI facilitam a experimentação com IA generativa e melhoram o desempenho no Windows 11, tornando a IA de ponta acessível a um público mais amplo.

Na Microsoft Build, a NVIDIA e a Microsoft revelaram uma pilha de inferência de IA projetada para simplificar o desenvolvimento e melhorar o desempenho da inferência para PCs Windows 11. Este conjunto de ferramentas é crítico para habilitar uma experiência de IA perfeita em computadores pessoais, tornando as ferramentas de IA mais responsivas e eficientes.

O NVIDIA TensorRT foi redesenhado especificamente para PCs RTX AI. Ele combina o desempenho do TensorRT com construção de motor just-in-time, no dispositivo, e um tamanho de pacote oito vezes menor para implantação de IA perfeita para mais de 100 milhões de PCs RTX AI. Esta otimização permite um processamento de IA mais rápido e eficiente em PCs, abrindo caminho para novas aplicações e capacidades.

Anunciado na Microsoft Build, o TensorRT para RTX é nativamente suportado pelo Windows ML – uma nova pilha de inferência que fornece aos desenvolvedores de aplicações ampla compatibilidade de hardware e desempenho de ponta. O TensorRT para RTX está disponível na prévia do Windows ML a partir de hoje e estará disponível como um kit de desenvolvimento de software autónomo do NVIDIA Developer em junho. Este desenvolvimento simplifica o processo para os desenvolvedores que procuram integrar capacidades de IA nas suas aplicações Windows, garantindo que a IA é acessível a uma vasta gama de soluções de software.

Em essência, a colaboração entre a NVIDIA e a Microsoft está a criar um ecossistema sinérgico onde os avanços na tecnologia de IA são rapidamente traduzidos em aplicações do mundo real, beneficiando pesquisadores, desenvolvedores e utilizadores finais. Esta parceria está estrategicamente posicionada para manter a sua liderança no campo da inteligência artificial em rápida evolução.

Análise Detalhada dos Avanços

Tecnologias de Ponta

A colaboração entre a NVIDIA e a Microsoft aproveita várias tecnologias de ponta para alcançar avanços em IA agente. Aqui, aprofundamo-nos nestes componentes-chave.

Microserviço NVIDIA ALCHEMI NIM: Este microserviço é uma ferramenta especializada otimizada para inferência de IA em simulações químicas. Sua função primária é acelerar a pesquisa em ciência dos materiais através de previsão precisa de propriedades e recomendação eficiente de candidatos. Ao permitir simulações mais rápidas e precisas, capacita os pesquisadores a identificar materiais promissores muito mais rapidamente do que os métodos tradicionais permitem.
Microserviços NVIDIA BioNeMo NIM: Estes microserviços fornecem fluxos de trabalho de IA pré-treinados para acelerar o desenvolvimento de modelos de IA para descoberta de fármacos. Os pesquisadores podem usá-los para desenvolver rapidamente modelos que preveem a eficácia de fármacos e potenciais efeitos colaterais, acelerando significativamente o desenvolvimento de novos fármacos.
GPUs NVIDIA Blackwell: Estas GPUs fornecem desempenho e eficiência aprimorados em cargas de trabalho de IA dentro de centros de dados Azure. Integradas em sistemas de escala de rack, suportam clientes como a OpenAI na execução de tarefas complexas de forma suave e eficaz.
Interconexões NVIDIA NVLink: Estas interconexões de alta velocidade servem para garantir comunicação de baixa latência entre GPUs, melhorando significativamente o desempenho geral do sistema. O resultado é computação mais rápida e eficiência aprimorada em várias operações de IA.
Rede NVIDIA Quantum InfiniBand: Isso suporta dimensionamento perfeito para milhares de GPUs Blackwell, tornando-o crucial para lidar com cargas de trabalho de IA generativas e de agente exigentes. As capacidades de rede garantem que modelos de IA em larga escala possam ser implantados e gerenciados de forma eficaz.
Modelos NVIDIA Llama Nemotron: Os modelos NVIDIA Llama Nemotron Super e Nano são projetados para fornecer raciocínio multi-etapa avançado, codificação e capacidades de agente. A precisão aprimorada e as velocidades de inferência mais rápidas permitem que os desenvolvedores criem aplicações de IA mais sofisticadas e eficientes.

Impacto na Pesquisa Científica

A integração das tecnologias da NVIDIA nas plataformas da Microsoft tem implicações profundas para a pesquisa científica em várias disciplinas.

Ciência dos Materiais: O microserviço NVIDIA ALCHEMI NIM ajuda na previsão precisa de propriedades e na recomendação de candidatos, permitindo a identificação mais rápida de novos materiais com as características desejadas.
Descoberta de Fármacos: Os microserviços BioNeMo NIM aceleram o desenvolvimento de modelos de IA, permitindo que os pesquisadores desenvolvam modelos que preveem a eficácia de fármacos e potenciais efeitos colaterais.
Arrefecimento de Centros de Dados: A Microsoft usou o Microsoft Discovery para detectar um novo protótipo de refrigerante ideal para arrefecimento por imersão em centros de dados em menos de 200 horas, em vez de meses ou anos com métodos tradicionais. Isso destaca a rápida aceleração das descobertas científicas.
Ciência de Proteínas, Modelagem Molecular e Análise Genômica: Os microserviços BioNeMo NIM permitem a aceleração nestes domínios. Levam a melhores cuidados com o paciente e inovação científica mais rápida.

Infraestrutura de IA Azure

O Azure AI Foundry da Microsoft e seus centros de dados representam investimentos significativos na criação de um ambiente ideal para executar cargas de trabalho de IA.

Máquinas Virtuais ND GB200 v6: Eles fornecem até 35 vezes mais taxa de transferência de inferência em comparação com as VMs ND H100 v5 anteriores, estabelecendo uma nova referência para cargas de trabalho de IA.
Designs de Servidor Personalizados: Designs de servidor personalizados são desenvolvidos para maximizar o desempenho e a eficiência, permitindo que as GPUs Blackwell operem em seu potencial máximo.
Otimizações NVIDIA no Azure: Otimizações contínuas de software em todas as arquiteturas NVIDIA no Azure maximizam a produtividade do desenvolvedor, reduzem o custo total de propriedade e aceleram todas as cargas de trabalho, aprimorando a eficiência por dólar e por watt para os clientes.

IA Generativa em Computadores Pessoais

Os avanços na tecnologia de IA também estão encontrando seu caminho para computadores pessoais, impulsionando novas possibilidades para aplicações de software e experiências do usuário.

PCs NVIDIA RTX AI: A experimentação simplificada com IA generativa e o aprimoramento de desempenho no Windows 11 são facilitados pelos PCs NVIDIA RTX AI. Eles tornam a tecnologia de IA de ponta mais acessível a um público mais amplo.
NVIDIA TensorRT: Este kit de desenvolvimento de software(SDK) foi otimizado para PCs RTX AI. Ele combina alto desempenho com um tamanho de pacote oito vezes menor para implantação de IA perfeita. Isso torna mais fácil para os desenvolvedores integrarem recursos de IA na aplicação.
Suporte ao Windows ML: O suporte nativo para TensorRT no Windows ML garante ampla compatibilidade de hardware e desempenho de ponta. Isso facilita a integração perfeita de IA em aplicações Windows.
Novas Experiências do Usuário: De humanos digitais a assistentes de escrita, agentes inteligentes e ferramentas criativas—a IA generativa está reformulando o software de PC e introduzindo experiências totalmente novas. Os usuários podem se beneficiar de aplicações mais interativas, inteligentes e criativas.

A Visão Estratégica

A colaboração entre a NVIDIA e a Microsoft é construída sobre uma visão estratégica, visando liderar o avanço da tecnologia de IA em vários setores. Os esforços colaborativos e as tecnologias são projetados para acelerar a adoção de IA em diferentes domínios, beneficiando não apenas pesquisadores e desenvolvedores, mas também usuários finais e organizações em todo o mundo.

Inovação: A ênfase contínua na inovação e colaboração acelera os avanços tecnológicos. Isso ajuda a manter a liderança em um campo em rápida evolução.
Acessibilidade: A NVIDIA e a Microsoft estão democratizando a IA, tornando-a acessível a desenvolvedores e usuários através de ferramentas otimizadas, integração com plataformas populares e melhorias na relação custo-benefício.
Desempenho & Eficiência: O foco em aprimorar tanto o desempenho quanto a eficiência de custos garante que os benefícios das tecnologias de IA estejam disponíveis para uma ampla gama de usuários, desde pesquisadores individuais até grandes empresas.
Aplicações do Mundo Real: Ao traduzir avanços de IA em soluções do mundo real, a NVIDIA e a Microsoft estão impulsionando benefícios tangíveis e transformando indústrias em todo o mundo.

atualizado em 2025-05-21

# Agent # Nvidia # Nemotron