驾驭推理革命
Nvidia 首席执行官 Jensen Huang 在加利福尼亚州圣何塞举行的公司年度软件开发者大会上发表讲话,强调了 Nvidia 在人工智能行业发生重大转变时的强势地位。他强调了当前 AI 模型从训练阶段向推理阶段的转变,企业越来越关注从这些模型中提取详细、可操作的见解。
应对投资者担忧和市场动态
Huang 的演讲以他标志性的黑色皮夹克和牛仔裤装扮进行,旨在捍卫 Nvidia 在高风险 AI 芯片市场的主导地位。最近,投资者担忧,因为有报道称,像中国的 DeepSeek 这样的竞争对手可以用可能更少的 AI 芯片实现类似的聊天机器人性能,这给 Nvidia 似乎不可动摇的领先地位蒙上了一层阴影。
尽管 Huang 发表了充满信心的讲话,但市场的反应却带着一定程度的怀疑。Nvidia 的股价下跌了 3.4%,反映了芯片指数的整体下跌,后者收盘下跌 1.6%。这种反应表明,市场可能已经消化了大部分预期消息,反映出对 Nvidia 长期战略采取了’观望’态度。
消除误解并强调计算需求
Huang 直接驳斥了他认为普遍存在的对 AI 不断发展的计算需求的误解。他大胆地表示,’几乎整个世界都错了’,强调了高级 AI 应用(尤其是在’Agentic AI’领域)所需的计算能力呈指数级增长。
Agentic AI 的特点是自主代理能够以最少的人工干预执行日常任务,需要显著提高的处理能力。Huang 估计,Agentic AI 和推理的计算需求’比我们去年这个时候认为需要的至少多 100 倍’。这种急剧增加突显了对高性能计算解决方案持续且可能被低估的需求。
训练与推理的二分法
Nvidia 当前挑战的一个关键因素在于 AI 市场不断变化的动态。该行业正从主要关注训练(使用大量数据集为聊天机器人等 AI 模型注入智能)转向推理。推理是训练好的模型利用其获得的知识为用户提供具体答案和解决方案的阶段。
这种转变给 Nvidia 带来了潜在的阻力,因为其最赚钱的芯片传统上是针对计算密集型训练阶段进行优化的。虽然 Nvidia 在过去十年中培育了一个强大的软件工具和开发者支持生态系统,但正是数据中心芯片(价格高达数万美元)推动了其大部分收入,去年总计 1305 亿美元。
保持势头:三年激增及未来
Nvidia 的股价经历了飞速上涨,在过去三年中价值翻了两番多。这一显著增长得益于该公司在推动包括 ChatGPT、Claude 和许多其他复杂 AI 系统出现方面的关键作用。该公司的硬件已成为尖端 AI 开发的代名词。
然而,保持这种势头需要适应以推理为中心的市场不断变化的需求。虽然建立在 Nvidia 芯片基础上的 AI 行业的长期愿景仍然引人注目,但短期投资者的预期对推理革命带来的直接挑战和机遇更为敏感。
推出下一代芯片:Blackwell Ultra 及其他
Huang 利用这次会议作为平台,宣布了一系列新的芯片发布,旨在巩固 Nvidia 在不断发展的 AI 格局中的地位。在这些公告中,包括计划于今年下半年发布的 Blackwell Ultra GPU 芯片。
与上一代 Blackwell 芯片相比,Blackwell Ultra 拥有增强的内存容量。这种增加的内存使其能够支持更大、更复杂的 AI 模型,从而满足高级 AI 应用不断增长的需求。
双重关注:响应能力和速度
Huang 强调,Nvidia 的芯片旨在解决 AI 性能的两个关键方面:响应能力和速度。这些芯片必须使 AI 系统能够对大量用户查询提供智能响应,同时以最小的延迟提供这些响应。
Huang 认为,Nvidia 的技术在两个领域都具有独特的优势。他以网络搜索为例,指出’如果你回答问题的时间太长,客户就不会再回来了’。这个类比强调了速度和效率在维持 AI 驱动应用程序的用户参与度和满意度方面的重要性。
未来路线图:Vera Rubin 和 Feynman
除了 Blackwell Ultra,Huang 还简要介绍了 Nvidia 未来的芯片路线图,透露了即将推出的 Vera Rubin 系统的详细信息。Vera Rubin 计划于 2026 年下半年发布,旨在接替 Blackwell,提供更快的速度和增强的功能。
更进一步,Huang 宣布 Rubin 芯片之后将推出 Feynman 芯片,预计将于 2028 年问世。这个多代路线图展示了 Nvidia 对持续创新的承诺,以及其在快速发展的 AI 硬件市场保持技术领先地位的决心。
应对行业挑战和 Blackwell 的推出
这些新芯片的发布正值 Blackwell 的市场进入速度比最初预期的要慢。据报道,一个设计缺陷导致了制造挑战,从而导致了延迟。这种情况反映了更广泛的行业困境,因为传统的将不断扩大的数据集输入到充满 Nvidia 芯片的大型数据中心的方法已经开始显示出收益递减的迹象。
尽管存在这些挑战,Nvidia 上个月报告称 Blackwell 的订单’惊人’,表明尽管最初遇到挫折,但对新芯片的需求强劲。
扩展生态系统:DGX 工作站和软件创新
除了核心芯片公告外,Huang 还推出了一款基于 Blackwell 芯片的强大新型个人电脑 DGX Workstation。这款工作站将由戴尔、联想和惠普等领先公司制造,对 Apple 的一些高端 Mac 产品构成了挑战。
Huang 自豪地展示了其中一台设备的主板,并宣称’这就是 PC 应该有的样子’。此举表明 Nvidia 有意将其在高性能计算市场的业务范围从数据中心扩展到专业工作站领域。
Dynamo:加速推理并与通用汽车合作
在软件方面,Huang 宣布发布 Dynamo,这是一款旨在加速 AI 应用程序推理过程的新软件工具。Dynamo 是免费提供的,旨在促进更广泛的采用并加速该领域的创新。
此外,Huang 还透露了与通用汽车的重要合作伙伴关系,选择 Nvidia 为其自动驾驶汽车车队提供动力。此次合作凸显了 Nvidia 在汽车行业日益增长的影响力及其对推进自动驾驶技术的承诺。这是一次备受瞩目的胜利,它展示了 Nvidia 应用的多样性。
前进的道路
Nvidia 在 AI 的未来上下了很大的赌注,他们的持续创新是关键。他们认识到需要适应向推理的转变,并且他们已经在开发可以同时执行这两项任务的芯片。凭借其成功的历史以及对研发的承诺,Nvidia 很可能在未来几年内继续成为 AI 行业的主要参与者。与主要技术和汽车公司的合作表明了 Nvidia 的发展方向。