黄仁勋谈DeepSeek计算密集型AI模型

推理革命:AI计算的范式转变

在周三 Nvidia 年度 GTC 大会上接受 CNBC 的 Jim Cramer 采访时,首席执行官黄仁勋阐述了中国初创公司 DeepSeek 创新人工智能模型的深远影响。与普遍的行业假设相反,黄仁勋强调,这个开创性的模型需要 更多 的计算能力,而不是更少。

黄仁勋称赞 DeepSeek 的 R1 模型“非常出色”,强调其作为“第一个开源推理模型”的先驱地位。他详细介绍了该模型以逐步方式剖析问题、生成各种潜在解决方案并严格评估其答案正确性的独特能力。

黄仁勋解释说,这种推理能力是计算需求增加的关键。“这种推理 AI 消耗的计算量是非推理 AI 的 100 倍,”他说,并强调与广泛的行业预期形成鲜明对比。这一发现挑战了传统的观点,即 AI 模型的进步总是会带来更高的效率和更少的计算需求。

一月抛售:对创新的误解

DeepSeek 模型于 1 月下旬发布,引发了剧烈的市场反应。由于投资者担心该模型可以在消耗更少能源和财务资源的同时实现与领先竞争对手相当的性能,AI 股票遭到大规模抛售。Nvidia 是 AI 芯片市场的主导力量,在单个交易日内暴跌 17%,市值蒸发近 6000 亿美元——这是美国公司历史上最大的单日跌幅。

然而,这种市场反应源于对该模型真实性质的误解。虽然 DeepSeek 的 R1 模型确实代表了 AI 能力的重大飞跃,但其以推理为中心的方法需要计算能力的大幅提升,这一事实最初被许多投资者忽视了。

Nvidia 的 GTC 大会:揭示 AI 基础设施的未来

黄仁勋还利用这次采访机会讨论了 Nvidia 在其 GTC 大会上发布的一些重要公告。他说,这些公告强调了该公司致力于构建支持蓬勃发展的 AI 革命所需的基础设施。

黄仁勋强调的重点领域包括:

  • 机器人 AI 基础设施: Nvidia 正在积极开发专门针对机器人应用独特需求的 AI 基础设施。这包括旨在加速各行业智能机器人开发和部署的硬件和软件解决方案。

  • 企业 AI 解决方案: 认识到 AI 对企业的变革潜力,Nvidia 正在与领先的企业技术提供商建立战略合作伙伴关系。这些合作旨在将 Nvidia 的 AI 技术集成到企业工作流程中,从而提高生产力、效率和决策能力。

    • Dell: Nvidia 正在与 Dell 合作,为企业提供强大的支持 AI 的服务器和工作站,这些服务器和工作站针对各种 AI 工作负载进行了优化。
    • HPE: 与 HPE 的合作侧重于为 AI 提供高性能计算解决方案,使企业能够应对复杂的 AI 挑战。
    • Accenture: Nvidia 正在与 Accenture 合作,帮助各行各业的企业采用和实施 AI 解决方案,利用 Accenture 的咨询专业知识和 Nvidia 的技术平台。
    • ServiceNow: Nvidia 的 AI 功能与 ServiceNow 平台的集成旨在自动化和优化 IT 服务管理,从而提高效率和用户体验。
    • CrowdStrike: Nvidia 正在与 CrowdStrike 合作,利用 AI 增强网络安全解决方案,从而实现更快、更有效的威胁检测和响应。

AI 热潮:从生成模型到推理模型

黄仁勋还就更广泛的 AI 格局发表了自己的看法,他观察到人们的关注点从纯粹的生成式 AI 模型转向了包含推理能力的模型。

  • 生成式 AI: 早期 AI 浪潮的重点是根据从现有数据中学习的模式创建新内容,例如文本、图像和音频。虽然令人印象深刻,但生成式 AI 模型通常缺乏推理、理解上下文或解决复杂问题的能力。

  • 推理 AI: 像 DeepSeek 的 R1 这样的推理模型的出现标志着向前迈出了重要一步。这些模型可以分析信息、进行推断并以更像人类的方式解决问题,从而为 AI 应用开辟了新的可能性。

黄仁勋的见解强调了 AI 领域的动态特性,持续创新推动着越来越复杂和强大的模型的发展。

万亿美元的机遇:AI 计算的未来

展望未来,黄仁勋预计全球计算资本支出将大幅增长,这主要是由 AI 不断升级的需求推动的。他预计,到本十年末,这些支出将达到惊人的一万亿美元,其中大部分用于与 AI 相关的基础设施。

“因此,到本十年末,我们在一万亿美元中所占的份额非常大,”黄仁勋评论道,并强调了 Nvidia 在这个快速发展的领域中的巨大增长潜力。“我们有很多基础设施需要建设。”

这一大胆的预测反映了 Nvidia 对 AI 变革力量的信心,以及其致力于提供将支撑这场革命的基础技术的承诺。随着 AI 模型不断进步,特别是在推理领域,对高性能计算基础设施的需求将飙升,为像 Nvidia 这样处于这一技术前沿的公司创造前所未有的机遇。

深入探讨:DeepSeek 推理模型的重要性

为了充分理解黄仁勋言论的含义,深入了解 DeepSeek 的 R1 模型及其推理能力的本质至关重要。

什么是推理模型?

与主要依赖模式识别和统计相关性的传统 AI 模型不同,推理模型旨在模仿人类的认知过程。他们可以:

  • 分析信息: 将复杂问题分解为更小、更易于管理的步骤。
  • 进行推断: 根据现有证据做出逻辑推论。
  • 评估解决方案: 评估潜在答案的有效性和正确性。
  • 适应新信息: 根据新的输入或反馈调整其推理过程。

这些能力使推理模型能够解决传统 AI 方法无法解决的问题。它们可以处理歧义、不确定性和不完整的信息,使其适用于更广泛的实际应用。

为什么推理需要更多计算?

推理模型计算需求的增加源于以下几个因素:

  • 多步处理: 推理涉及一系列相互关联的步骤,每个步骤都需要计算资源。
  • 探索多种可能性: 推理模型通常在得出最佳解决方案之前会探索多种潜在的解决方案。
  • 知识表示: 推理模型需要复杂的方法来表示和操作知识,这可能需要大量的计算。
  • 验证和确认: 对解决方案的严格评估增加了计算负担。

从本质上讲,推理模型牺牲了计算效率来增强认知能力。他们优先考虑解决复杂问题的能力,而不是最小化资源消耗。

更广泛的影响:对 AI 行业的影响

黄仁勋关于 DeepSeek 模型和 AI 计算未来的评论对该行业具有深远的影响:

  • 对专用硬件的需求增加: 推理模型的兴起将推动对专用硬件(例如 GPU 和 AI 加速器)的需求,这些硬件可以有效地处理这些模型的计算需求。
  • 关注 AI 基础设施: 公司将需要大力投资 AI 基础设施,以支持推理模型的开发和部署。
  • AI 研究重点的转变: DeepSeek 模型的成功可能会刺激对基于推理的 AI 方法的进一步研究。
  • AI 应用的新机遇: 推理模型将为 AI 在科学发现、金融建模和医学诊断等领域开辟新的可能性。
  • 竞争与创新: 开发更强大、更高效的推理模型的竞赛将加剧竞争并推动 AI 芯片市场的创新。

AI 格局正在迅速发展,黄仁勋的见解为了解这项变革性技术的未来提供了宝贵的视角。推理模型的兴起代表了一个重要的里程碑,为 AI 系统铺平了道路,使其能够解决日益复杂的问题并开辟创新的新领域。Nvidia 专注于高性能计算和 AI 基础设施,完全有能力在这种激动人心的发展中发挥核心作用。该公司致力于建设“未来的基础设施”,这突显了其对 AI 变革力量的信念,以及其重塑行业和重新定义可能性的潜力。