英伟达跃进：推理模型与高级AI智能体构建块 | zh-CN

Llama Nemotron崛起：增强推理能力，打造更智能的AI

英伟达战略的核心是推出Llama Nemotron系列AI模型。这些模型拥有显著增强的推理能力，标志着在追求更复杂AI的道路上迈出了重要一步。Nemotron系列基于Meta Platforms Inc.的开源Llama模型构建，旨在为开发人员提供创建高级AI智能体的强大基础。这些智能体被设想为在最少的人工监督下执行任务，代表了AI自主性的重大进步。

英伟达通过精心的训练后增强功能实现了这些改进。可以把它想象成一个已经很有技能的学生，并为他们提供专门的辅导。这种’辅导’侧重于提高模型在多步数学、编码、复杂决策和整体推理方面的能力。据英伟达称，与原始Llama模型相比，其结果是准确率提高了20%。但改进不仅仅在于准确性。推理速度——本质上是模型处理信息和提供答案的速度——提高了五倍。这意味着可以处理更复杂的任务，同时降低运营成本，这是实际部署的关键因素。

Llama Nemotron模型通过英伟达的NIM微服务平台提供三种不同的尺寸：

Nano： 专为部署在处理能力有限的设备上而设计，例如个人计算机和边缘设备。这为AI智能体在资源受限的环境中运行开辟了可能性。
Super： 针对在单个图形处理单元 (GPU) 上执行进行了优化。这在性能和资源需求之间提供了平衡。
Ultra： 专为最高性能而设计，需要多个GPU服务器。这适用于需要最高水平AI能力的应用。

优化过程本身利用了Nvidia DGX Cloud平台，利用来自Nvidia Nemotron的高质量合成数据，以及英伟达自己策划的数据集。为了促进透明度和协作，英伟达将这些数据集、使用的工具以及其优化技术的细节公开。这种开放的方法鼓励更广泛的AI社区在英伟达的工作基础上再接再厉，并开发他们自己的基础推理模型。

Llama Nemotron的影响已经在英伟达建立的合作伙伴关系中显现出来。微软公司 (Microsoft Corp.) 等主要参与者正在将这些模型集成到他们的云服务中。

微软正在其Azure AI Foundry服务上提供这些模型。
对于使用Azure AI Agent Service for Microsoft 365创建新智能体的客户，它们也将作为一个选项提供。
SAP SE正在利用Llama Nemotron来增强其AI助手Joule及其更广泛的SAP Business AI解决方案组合。
其他知名公司，包括埃森哲 (Accenture Plc)、Atlassian Corp.、Box Inc.和ServiceNow Inc.，也在与英伟达合作，为其客户提供访问这些模型的权限。

超越模型：智能体AI的综合生态系统

英伟达明白，构建AI智能体需要的不仅仅是强大的语言模型。需要一个完整的生态系统，包括基础设施、工具、数据管道等等。该公司正在通过一套额外的智能体AI构建模块来满足这些需求，这些模块也在GTC 2025上宣布。

Nvidia AI-Q Blueprint：将知识与行动联系起来

该框架旨在促进知识库和AI智能体之间的连接，使它们能够自主行动。该蓝图使用Nvidia NIM微服务构建，并与Nvidia NeMo Retriever集成，简化了为AI智能体检索多模态数据（各种格式的信息，如文本、图像和音频）的过程。

Nvidia AI Data Platform：优化推理的数据流

这个可定制的参考设计正在向主要的存储提供商提供。目标是协助戴尔科技公司 (Dell Technologies Inc.)、惠普企业 (Hewlett Packard Enterprise Co.)、日立万塔拉 (Hitachi Vantara)、IBM Corp.、NetApp Inc.、Nutanix Inc.、Vast Data Inc.和Pure Storage Inc.等公司开发专门针对智能体AI推理工作负载的更高效的数据平台。通过将优化的存储资源与英伟达的加速计算硬件相结合，开发人员可以期望在AI推理方面获得显著的性能提升。这是通过确保信息从数据库到AI模型的平稳快速流动来实现的。

增强的Nvidia NIM微服务：持续学习和适应性

英伟达的NIM微服务已更新，以优化智能体AI推理，支持持续学习和适应性。这些微服务使客户能够可靠地部署最新、最强大的智能体AI模型，包括英伟达的Llama Nemotron以及来自Meta、微软和Mistral AI等公司的替代方案。

Nvidia NeMo微服务：构建强大的数据飞轮

英伟达还在增强其NeMo微服务，该微服务为开发人员提供了一个框架，用于创建强大而高效的数据飞轮。这对于确保AI智能体能够根据人工生成和AI生成的反馈不断学习和改进至关重要。

战略合作伙伴关系：推动整个AI领域的创新

英伟达对智能体AI的承诺延伸到其与其他行业领导者的合作。

扩大与甲骨文的合作：Oracle云基础设施上的智能体AI

英伟达正在扩大与甲骨文公司 (Oracle Corp.) 的合作，将智能体AI功能引入Oracle云基础设施 (OCI)。此次合作涉及将英伟达的加速GPU和推理软件集成到甲骨文的云基础设施中，使其与甲骨文的生成式AI服务兼容。这将加速OCI上AI智能体的开发。英伟达现在通过OCI控制台本地提供160多种AI工具和NIM微服务。两家公司还在努力加速Oracle Database 23ai平台上的向量搜索。

深化与谷歌的合作：增强AI访问和完整性

英伟达还提供了有关其与谷歌 (Google LLC) 扩大合作的最新信息，披露了几项旨在改善AI及其底层工具访问的举措。

一个关键亮点是英伟达成为第一个利用Google DeepMind的SynthID的组织。这项技术直接将数字水印嵌入到AI生成的内容中，包括图像、视频和文本。这有助于保持AI输出的完整性并打击虚假信息。SynthID最初与英伟达的Cosmos World基础模型集成。

此外，英伟达还与谷歌的DeepMind研究人员合作，为英伟达GPU优化Gemma（一系列开源、轻量级AI模型）。两家公司还在合作开展一项计划，以构建具有抓取技能的AI驱动机器人，以及其他项目。

谷歌和英伟达的研究人员和工程师之间的合作正在解决广泛的挑战。从药物发现到机器人技术，突出了其变革潜力。

更新于 2025-03-20

# Agent # Nvidia # Nemotron