Llama Nemotron崛起:增强推理能力,打造更智能的AI
英伟达战略的核心是推出Llama Nemotron系列AI模型。这些模型拥有显著增强的推理能力,标志着在追求更复杂AI的道路上迈出了重要一步。Nemotron系列基于Meta Platforms Inc.的开源Llama模型构建,旨在为开发人员提供创建高级AI智能体的强大基础。这些智能体被设想为在最少的人工监督下执行任务,代表了AI自主性的重大进步。
英伟达通过精心的训练后增强功能实现了这些改进。可以把它想象成一个已经很有技能的学生,并为他们提供专门的辅导。这种’辅导’侧重于提高模型在多步数学、编码、复杂决策和整体推理方面的能力。据英伟达称,与原始Llama模型相比,其结果是准确率提高了20%。但改进不仅仅在于准确性。推理速度——本质上是模型处理信息和提供答案的速度——提高了五倍。这意味着可以处理更复杂的任务,同时降低运营成本,这是实际部署的关键因素。
Llama Nemotron模型通过英伟达的NIM微服务平台提供三种不同的尺寸:
- Nano: 专为部署在处理能力有限的设备上而设计,例如个人计算机和边缘设备。这为AI智能体在资源受限的环境中运行开辟了可能性。
- Super: 针对在单个图形处理单元 (GPU) 上执行进行了优化。这在性能和资源需求之间提供了平衡。
- Ultra: 专为最高性能而设计,需要多个GPU服务器。这适用于需要最高水平AI能力的应用。
优化过程本身利用了Nvidia DGX Cloud平台,利用来自Nvidia Nemotron的高质量合成数据,以及英伟达自己策划的数据集。为了促进透明度和协作,英伟达将这些数据集、使用的工具以及其优化技术的细节公开。这种开放的方法鼓励更广泛的AI社区在英伟达的工作基础上再接再厉,并开发他们自己的基础推理模型。
Llama Nemotron的影响已经在英伟达建立的合作伙伴关系中显现出来。微软公司 (Microsoft Corp.) 等主要参与者正在将这些模型集成到他们的云服务中。
- 微软正在其Azure AI Foundry服务上提供这些模型。
- 对于使用Azure AI Agent Service for Microsoft 365创建新智能体的客户,它们也将作为一个选项提供。
- SAP SE正在利用Llama Nemotron来增强其AI助手Joule及其更广泛的SAP Business AI解决方案组合。
- 其他知名公司,包括埃森哲 (Accenture Plc)、Atlassian Corp.、Box Inc.和ServiceNow Inc.,也在与英伟达合作,为其客户提供访问这些模型的权限。
超越模型:智能体AI的综合生态系统
英伟达明白,构建AI智能体需要的不仅仅是强大的语言模型。需要一个完整的生态系统,包括基础设施、工具、数据管道等等。该公司正在通过一套额外的智能体AI构建模块来满足这些需求,这些模块也在GTC 2025上宣布。
Nvidia AI-Q Blueprint:将知识与行动联系起来
该框架旨在促进知识库和AI智能体之间的连接,使它们能够自主行动。该蓝图使用Nvidia NIM微服务构建,并与Nvidia NeMo Retriever集成,简化了为AI智能体检索多模态数据(各种格式的信息,如文本、图像和音频)的过程。
Nvidia AI Data Platform:优化推理的数据流
这个可定制的参考设计正在向主要的存储提供商提供。目标是协助戴尔科技公司 (Dell Technologies Inc.)、惠普企业 (Hewlett Packard Enterprise Co.)、日立万塔拉 (Hitachi Vantara)、IBM Corp.、NetApp Inc.、Nutanix Inc.、Vast Data Inc.和Pure Storage Inc.等公司开发专门针对智能体AI推理工作负载的更高效的数据平台。通过将优化的存储资源与英伟达的加速计算硬件相结合,开发人员可以期望在AI推理方面获得显著的性能提升。这是通过确保信息从数据库到AI模型的平稳快速流动来实现的。
增强的Nvidia NIM微服务:持续学习和适应性
英伟达的NIM微服务已更新,以优化智能体AI推理,支持持续学习和适应性。这些微服务使客户能够可靠地部署最新、最强大的智能体AI模型,包括英伟达的Llama Nemotron以及来自Meta、微软和Mistral AI等公司的替代方案。
Nvidia NeMo微服务:构建强大的数据飞轮
英伟达还在增强其NeMo微服务,该微服务为开发人员提供了一个框架,用于创建强大而高效的数据飞轮。这对于确保AI智能体能够根据人工生成和AI生成的反馈不断学习和改进至关重要。
战略合作伙伴关系:推动整个AI领域的创新
英伟达对智能体AI的承诺延伸到其与其他行业领导者的合作。
扩大与甲骨文的合作:Oracle云基础设施上的智能体AI
英伟达正在扩大与甲骨文公司 (Oracle Corp.) 的合作,将智能体AI功能引入Oracle云基础设施 (OCI)。此次合作涉及将英伟达的加速GPU和推理软件集成到甲骨文的云基础设施中,使其与甲骨文的生成式AI服务兼容。这将加速OCI上AI智能体的开发。英伟达现在通过OCI控制台本地提供160多种AI工具和NIM微服务。两家公司还在努力加速Oracle Database 23ai平台上的向量搜索。
深化与谷歌的合作:增强AI访问和完整性
英伟达还提供了有关其与谷歌 (Google LLC) 扩大合作的最新信息,披露了几项旨在改善AI及其底层工具访问的举措。
一个关键亮点是英伟达成为第一个利用Google DeepMind的SynthID的组织。这项技术直接将数字水印嵌入到AI生成的内容中,包括图像、视频和文本。这有助于保持AI输出的完整性并打击虚假信息。SynthID最初与英伟达的Cosmos World基础模型集成。
此外,英伟达还与谷歌的DeepMind研究人员合作,为英伟达GPU优化Gemma(一系列开源、轻量级AI模型)。两家公司还在合作开展一项计划,以构建具有抓取技能的AI驱动机器人,以及其他项目。
谷歌和英伟达的研究人员和工程师之间的合作正在解决广泛的挑战。从药物发现到机器人技术,突出了其变革潜力。