英伟达企业级AI推进:新计算范式

为企业及其他领域调整AI

在最近的GPU技术大会 (GTC) 2025上,Nvidia首席执行官黄仁勋概述了该公司如何调整其加速计算能力以适应广泛的应用。虽然聚光灯集中在Nvidia的下一代’Blackwell’ B300 GPU和未来的’Rubin’系列加速器上,但黄仁勋也强调了该公司致力于满足企业、边缘计算和物理AI领域的需求。

黄仁勋强调,虽然云服务提供商被Nvidia的尖端技术和全栈方法所吸引,但AI的更广泛采用需要更细致的策略。他说:’加速计算不仅仅是芯片,甚至不仅仅是芯片和库、编程模型。它是芯片、编程模型以及在其之上运行的大量软件。’

AI的演变:从云端到无处不在

AI最初的势头可能起源于云端,但其发展轨迹显然远远超出了云端。随着AI渗透到各个领域,它遇到了不同的系统配置、操作环境、特定领域的库和使用模式。黄仁勋强调了这种扩展,指出了企业IT、制造业、机器人技术、自动驾驶汽车,甚至新兴GPU云提供商的独特需求。

计算的基本性质正在被AI和机器学习重塑,影响着从处理器和操作系统到应用程序及其编排的一切。企业工作流程正在从简单的数据检索发展到与AI系统进行交互式问答。

AI代理和数字工作者的崛起

黄仁勋设想了一个未来,AI代理成为数字劳动力的重要组成部分。他预测,除了全球10亿知识工作者之外,还将出现100亿数字工作者,无缝协作。AI代理的这种无处不在的存在需要一种新型计算机,针对其独特的操作需求进行优化。

推出AI时代的新硬件

Nvidia正在通过推出两款个人AI超级计算机来满足这一需求:DGX Spark和DGX Station。这些桌面系统专为推理和其他任务而设计,为本地操作或与Nvidia的DGX Cloud和其他加速云环境集成提供了灵活性。

DGX Spark拥有GB10 Grace Blackwell Superchip,为AI微调和推理提供了卓越的性能。DGX Station是一款功能更强大的桌面系统,配备GB300 Grace-Blackwell Ultra Desktop Superchip,提供高达784 GB的相干内存、Nvidia的ConnectX-8 SuperNIC、AI Enterprise软件平台以及对NIM AI微服务的访问。

超越代理:AI Reasoning的曙光

这些新系统不仅为企业提供了强大的AI工作负载工具,还为AI进化的下一阶段:Reasoning模型铺平了道路。这些模型代表了超越基本AI代理的重大飞跃,能够解决复杂问题并展现出远远超过当前AI聊天机器人的提示和回复性质的Reasoning能力。

黄仁勋描述了这一进步,他说:’我们现在拥有可以Reasoning的AI,这从根本上说是将问题逐步分解。现在我们拥有可以逐步Reasoning的AI,使用……称为思维链、N中最佳、一致性检查、路径规划等多种不同技术。’

Nemotron模型:赋能AI Reasoning

基于在消费电子展上发布的Llama Nemotron和Cosmos Nemotron模型的基础上,Nvidia在GTC上推出了一系列开放的Llama Nemotron模型。这些模型在数学、编码、决策和指令遵循等多步骤任务中拥有增强的Reasoning能力。

Nvidia企业生成AI软件副总裁Kari Briski强调了该公司对开发人员支持的承诺。Nvidia正在提供数据集,包括600亿个token的合成生成数据,以及促进采用这些模型的技术。

Briski解释说:’就像人类一样,代理需要理解上下文来分解复杂的请求,理解用户的意图,并实时适应。’

Nemotron模型提供不同级别的Reasoning能力,并有三种尺寸:Nano(针对PC和边缘设备优化)、Super(在单个GPU上具有高精度和吞吐量)和Ultra(专为多个GPU设计)。

AI-Q Blueprint:将数据连接到Reasoning代理

Nvidia的AI Enterprise软件平台正在通过AI-Q Blueprint进行增强,这是一种基于NIM的产品,使企业能够将专有数据连接到Reasoning AI代理。这个开放软件与Nvidia的NeMo Retriever工具集成,允许查询各种数据类型(文本、图像、视频),并促进Nvidia的加速计算与第三方存储平台和软件(包括Llama Nemotron模型)之间的协作。

Briski强调了对开发团队的好处,他说:’对于连接代理的团队,该蓝图提供了对代理活动的可观察性和透明度,允许开发人员随着时间的推移改进代理。开发人员可以提高代理的准确性,并将完成这些任务的时间从几小时缩短到几分钟。’

AI数据平台:企业基础设施的参考设计

Nvidia的AI数据平台是企业基础设施的参考设计,结合了使用AI-Q Blueprint构建的AI查询代理。

物理AI:连接数字世界和物理世界

黄仁勋还谈到了蓬勃发展的物理AI领域,该领域涉及将AI集成到物理系统中,以实现现实世界的感知和交互。他预测,这个领域可能成为AI市场的最大部分。

黄仁勋解释说:’AI理解物理世界,比如摩擦和惯性、因果关系、物体恒存性,这种理解物理世界、三维世界的能力。这将开启物理AI的新时代,并将推动机器人技术的发展。’

机器人和自动驾驶汽车的进步

几项公告强调了Nvidia对物理AI的承诺,包括推出Nvidia AI Dataset,专门为机器人和自动驾驶汽车设计。该数据集使开发人员能够预训练、测试、验证和微调基础模型,利用Nvidia的Cosmos世界模型开发平台、Drive AV软件、Isaac AI机器人开发平台和Metropolis智能城市框架中使用的真实和合成数据。

该数据集的初始版本可在Hugging Face上获得,提供15TB的机器人训练数据,并计划在不久的将来支持自动驾驶汽车开发。
此外,Nvidia宣布了Isaac GROOT N1,这是一个用于人形机器人的基础模型。它在真实和合成数据上进行训练,代表了Project GROOT的进步。

拓展AI视野

Nvidia的战略举措展示了AI未来的清晰愿景,将其影响力远远超出云的范围,扩展到企业和物理世界的核心。通过结合尖端硬件、创新软件平台以及对开发人员赋能的承诺,Nvidia正在将自己定位为下一波AI创新的驱动力。Reasoning能力的引入,加上物理AI工具和数据集的开发,标志着朝着AI与我们的日常生活无缝集成、改变行业并重新定义我们与技术交互方式的未来迈出了重要一步。对企业解决方案、边缘计算和机器人技术的关注突显了Nvidia对AI领域多样化和不断变化的需求的理解,巩固了其作为这一变革性技术革命领导者的地位。