Na sua conferência GTC 2025, a Nvidia sinalizou um grande impulso no florescente campo da inteligência artificial agentiva. A empresa não está apenas focada na infraestrutura subjacente que alimenta esses sistemas; está também a desenvolver os próprios modelos que irão impulsionar a próxima geração de agentes de IA autónomos.
A Ascensão do Llama Nemotron: Raciocínio Aprimorado para IA Mais Inteligente
No centro da estratégia da Nvidia está a revelação da família de modelos de IA Llama Nemotron. Estes modelos ostentam capacidades de raciocínio significativamente aprimoradas, marcando um passo em frente na busca por uma IA mais sofisticada. Construída sobre os modelos Llama de código aberto da Meta Platforms Inc., a série Nemotron foi projetada para fornecer aos desenvolvedores uma base robusta para a criação de agentes de IA avançados. Estes agentes são concebidos para executar tarefas com o mínimo de supervisão humana, representando um avanço significativo na autonomia da IA.
A Nvidia alcançou essas melhorias através de aprimoramentos meticulosos pós-treino. Pense nisso como pegar num aluno já qualificado e fornecer-lhe tutoria especializada. Essa ‘tutoria’ focou-se em impulsionar as habilidades dos modelos em matemática multi-etapas, codificação, tomada de decisões complexas e raciocínio geral. O resultado, de acordo com a Nvidia, é um aumento de 20% na precisão em comparação com os modelos Llama originais. Mas os aprimoramentos não param na precisão. A velocidade de inferência – essencialmente, a rapidez com que o modelo pode processar informações e fornecer uma resposta – teve um aumento de cinco vezes. Isso traduz-se no tratamento de tarefas mais complexas com custos operacionais reduzidos, um fator crucial para a implementação no mundo real.
Os modelos Llama Nemotron são oferecidos em três tamanhos distintos através da plataforma de microsserviços NIM da Nvidia:
- Nano: Adaptado para implementação em dispositivos com poder de processamento limitado, como computadores pessoais e dispositivos de edge. Isso abre possibilidades para que os agentes de IA operem em ambientes com recursos limitados.
- Super: Otimizado para execução numa única unidade de processamento gráfico (GPU). Isso fornece um equilíbrio entre desempenho e requisitos de recursos.
- Ultra: Projetado para desempenho máximo, exigindo vários servidores GPU. Isso atende a aplicações que exigem os mais altos níveis de capacidade de IA.
O próprio processo de refinamento aproveitou a plataforma Nvidia DGX Cloud, utilizando dados sintéticos de alta qualidade do Nvidia Nemotron, juntamente com os próprios conjuntos de dados com curadoria da Nvidia. Num movimento que promove a transparência e a colaboração, a Nvidia está a tornar públicos esses conjuntos de dados, as ferramentas utilizadas e os detalhes das suas técnicas de otimização. Essa abordagem aberta incentiva a comunidade de IA mais ampla a construir sobre o trabalho da Nvidia e a desenvolver os seus próprios modelos de raciocínio fundamentais.
O impacto do Llama Nemotron já é evidente nas parcerias que a Nvidia estabeleceu. Grandes players como a Microsoft Corp. estão a integrar esses modelos nos seus serviços baseados na nuvem.
- A Microsoft está a disponibilizá-los no seu serviço Azure AI Foundry.
- Eles também serão oferecidos como uma opção para clientes que criam novos agentes usando o Azure AI Agent Service para Microsoft 365.
- A SAP SE está a aproveitar o Llama Nemotron para aprimorar o seu assistente de IA, Joule, e o seu portfólio mais amplo de soluções SAP Business AI.
- Outras empresas proeminentes, incluindo Accenture Plc, Atlassian Corp., Box Inc. e ServiceNow Inc., também estão a colaborar com a Nvidia para fornecer aos seus clientes acesso a esses modelos.
Além dos Modelos: Um Ecossistema Abrangente para IA Agentiva
A Nvidia entende que a construção de agentes de IA requer mais do que apenas modelos de linguagem poderosos. É necessário um ecossistema completo, abrangendo infraestrutura, ferramentas, pipelines de dados e muito mais. A empresa está a atender a essas necessidades com um conjunto de blocos de construção adicionais de IA agentiva, também anunciados na GTC 2025.
O Blueprint Nvidia AI-Q: Conectando Conhecimento à Ação
Esta estrutura foi projetada para facilitar a conexão entre bases de conhecimento e agentes de IA, permitindo que eles ajam de forma autónoma. Construído usando microsserviços Nvidia NIM e integrado com o Nvidia NeMo Retriever, o blueprint simplifica o processo de recuperação de dados multimodais – informações em vários formatos, como texto, imagens e áudio – para agentes de IA.
A Plataforma de Dados Nvidia AI: Otimizando o Fluxo de Dados para Raciocínio
Este design de referência personalizável está a ser disponibilizado aos principais fornecedores de armazenamento. O objetivo é ajudar empresas como Dell Technologies Inc., Hewlett Packard Enterprise Co., Hitachi Vantara, IBM Corp., NetApp Inc.. Nutanix Inc., Vast Data Inc. e Pure Storage Inc. no desenvolvimento de plataformas de dados mais eficientes especificamente para cargas de trabalho de inferência de IA agentiva. Ao combinar recursos de armazenamento otimizados com o hardware de computação acelerada da Nvidia, os desenvolvedores podem esperar ganhos de desempenho significativos no raciocínio da IA. Isso é alcançado garantindo um fluxo suave e rápido de informações do banco de dados para o modelo de IA.
Microsserviços Nvidia NIM Aprimorados: Aprendizagem Contínua e Adaptabilidade
Os microsserviços NIM da Nvidia foram atualizados para otimizar a inferência de IA agentiva, suportando aprendizagem contínua e adaptabilidade. Esses microsserviços permitem que os clientes implementem de forma confiável os modelos de IA agentiva mais recentes e poderosos, incluindo o Llama Nemotron da Nvidia e alternativas de empresas como Meta, Microsoft e Mistral AI.
Microsserviços Nvidia NeMo: Construindo Flywheels de Dados Robustos
A Nvidia também está a aprimorar os seus microsserviços NeMo, que fornecem uma estrutura para os desenvolvedores criarem flywheels de dados robustos e eficientes. Isso é crucial para garantir que os agentes de IA possam aprender e melhorar continuamente com base no feedback gerado por humanos e por IA.
Parcerias Estratégicas: Impulsionando a Inovação em Todo o Cenário da IA
O compromisso da Nvidia com a IA agentiva estende-se às suas colaborações com outros líderes da indústria.
Expansão da Parceria com a Oracle: IA Agentiva na Oracle Cloud Infrastructure
A Nvidia está a ampliar a sua colaboração com a Oracle Corp. para trazer recursos de IA agentiva para a Oracle Cloud Infrastructure (OCI). Esta parceria envolve a integração das GPUs aceleradas e do software de inferência da Nvidia na infraestrutura de nuvem da Oracle, tornando-os compatíveis com os serviços de IA generativa da Oracle. Isso irá acelerar o desenvolvimento de agentes de IA na OCI. A Nvidia oferece agora mais de 160 ferramentas de IA e microsserviços NIM nativamente através do console OCI. As duas empresas também estão a trabalhar para acelerar a pesquisa vetorial na plataforma Oracle Database 23ai.
Aprofundando a Colaboração com o Google: Melhorando o Acesso e a Integridade da IA
A Nvidia também forneceu atualizações sobre as suas colaborações expandidas com o Google LLC, revelando várias iniciativas destinadas a melhorar o acesso à IA e às suas ferramentas subjacentes.
Um destaque importante é a Nvidia tornar-se a primeira organização a aproveitar o SynthID do Google DeepMind. Esta tecnologia incorpora diretamente marcas d’água digitais em conteúdo gerado por IA, incluindo imagens, vídeo e texto. Isso ajuda a preservar a integridade das saídas de IA e a combater a desinformação. O SynthID está a ser inicialmente integrado com os modelos de fundação Cosmos World da Nvidia.
Além disso, a Nvidia colaborou com os pesquisadores do Google DeepMind para otimizar o Gemma, uma família de modelos de IA leves e de código aberto, para GPUs Nvidia. As duas empresas também estão a colaborar numa iniciativa para construir robôs com inteligência artificial com habilidades de agarrar, entre outros projetos.
As colaborações entre os pesquisadores e engenheiros do Google e da Nvidia estão a enfrentar uma ampla gama de desafios. Da descoberta de medicamentos à robótica, destacando o potencial transformador da IA.