為企業及其他領域調整 AI
在最近的 GPU 技術大會 (GTC) 2025 上,Nvidia 的 CEO Jensen Huang 概述了該公司如何將其加速運算能力應用於廣泛的應用。雖然焦點集中在 Nvidia 的下一代 ‘Blackwell’ B300 GPU 和未來的 ‘Rubin’ 系列加速器上,Huang 也強調了公司致力於滿足企業、邊緣運算和實體 AI 領域的需求。
Huang 強調,雖然雲端服務供應商被 Nvidia 的尖端技術和全端方法所吸引,但 AI 的更廣泛採用需要更細緻的策略。他說:「加速運算不僅僅是晶片,甚至不僅僅是晶片和函式庫、程式設計模型。而是晶片、程式設計模型以及在其之上運作的一整套軟體。」
AI 的演進:從雲端到無處不在
AI 最初的動力可能源於雲端,但其發展軌跡顯然遠遠超出了雲端。隨著 AI 滲透到各個領域,它遇到了不同的系統配置、操作環境、特定領域的函式庫和使用模式。Huang 強調了這種擴展,並指出了企業 IT、製造業、機器人技術、自動駕駛汽車,甚至新興 GPU 雲端供應商的獨特需求。
運算的本質正受到 AI 和機器學習的重塑,影響著從處理器和作業系統到應用程式及其協調的一切。企業工作流程正從簡單的資料檢索演變為與 AI 系統的互動式問答互動。
AI 代理和數位工作者的崛起
Huang 預見到 AI 代理將成為數位勞動力不可或缺的一部分。他預測,除了全球 10 億知識工作者之外,還將出現 100 億數位工作者,他們將無縫協作。AI 代理的無處不在需要一種新型電腦,針對其獨特的操作需求進行最佳化。
推出 AI 時代的新硬體
Nvidia 正在透過推出兩款個人 AI 超級電腦來滿足這一需求:DGX Spark 和 DGX Station。這些桌上型系統專為推論和其他任務而設計,提供了靈活性,可以本地操作或與 Nvidia 的 DGX Cloud 和其他加速雲端環境整合。
DGX Spark 擁有 GB10 Grace Blackwell Superchip,為 AI 微調和推論提供了卓越的性能。DGX Station 是一款功能更強大的桌上型系統,配備 GB300 Grace-Blackwell Ultra Desktop Superchip,提供高達 784 GB 的一致性記憶體、Nvidia 的 ConnectX-8 SuperNIC、AI Enterprise 軟體平台以及對 NIM AI 微服務的存取。
超越代理:AI 推理的曙光
這些新系統不僅為企業提供了強大的 AI 工作負載工具,還為 AI 演進的下一階段:推理模型鋪平了道路。這些模型代表了超越基本 AI 代理的重大飛躍,能夠解決複雜問題並展現出遠超當前 AI 聊天機器人提示和回覆性質的推理能力。
Huang 描述了這一進展,他說:「我們現在擁有的 AI 可以推理,這基本上是關於逐步分解問題。現在我們擁有的 AI 可以使用……稱為思維鏈、最佳 N、一致性檢查、路徑規劃等各種不同技術逐步推理。」
Nemotron 模型:賦能 AI 推理
基於在消費電子展上發佈 Llama Nemotron 和 Cosmos Nemotron 模型的基礎上,Nvidia 在 GTC 上推出了一系列開放的 Llama Nemotron 模型。這些模型在數學、編碼、決策和指令遵循等多步驟任務中擁有增強的推理能力。
Nvidia 企業生成式 AI 軟體副總裁 Kari Briski 強調了公司對開發者支援的承諾。Nvidia 正在提供資料集,包括 600 億個 token 的合成生成資料,以及促進採用這些模型的技術。
Briski 解釋說:「就像人類一樣,代理需要理解上下文來分解複雜的請求,理解使用者的意圖,並即時適應。」
Nemotron 模型提供不同級別的推理能力,並有三種尺寸:Nano(針對 PC 和邊緣裝置進行最佳化)、Super(在單個 GPU 上具有高準確性和吞吐量)和 Ultra(專為多個 GPU 設計)。
AI-Q Blueprint:將資料連接到推理代理
Nvidia 的 AI Enterprise 軟體平台正在透過 AI-Q Blueprint 進行增強,這是一個基於 NIM 的產品,使企業能夠將專有資料連接到推理 AI 代理。這個開放軟體與 Nvidia 的 NeMo Retriever 工具整合,允許查詢不同類型的資料(文字、圖像、影片),並促進 Nvidia 的加速運算與第三方儲存平台和軟體(包括 Llama Nemotron 模型)之間的協作。
Briski 強調了對開發團隊的好處,他說:「對於連接代理的團隊,該藍圖提供了對代理活動的可觀察性和透明度,允許開發人員隨著時間的推移改進代理。開發人員可以提高代理的準確性,並將完成這些任務的時間從數小時縮短到數分鐘。」
AI Data Platform:企業基礎架構的參考設計
Nvidia 的 AI Data Platform 作為企業基礎架構的參考設計,整合了使用 AI-Q Blueprint 構建的 AI 查詢代理。
實體 AI:連接數位和實體世界
Huang 還談到了蓬勃發展的實體 AI 領域,該領域涉及將 AI 整合到實體系統中,以實現真實世界的感知和互動。他預測,這個領域可能成為 AI 市場的最大部分。
Huang 解釋說:「AI 理解實體世界,例如摩擦力和慣性、因果關係、物體恆存性,這種理解實體世界、三維世界的能力。這將開啟實體 AI 的新時代,並將賦能機器人技術。」
機器人技術和自動駕駛汽車的進展
幾項公告強調了 Nvidia 對實體 AI 的承諾,包括推出 Nvidia AI Dataset,專為機器人技術和自動駕駛汽車設計。該資料集使開發人員能夠利用 Nvidia 的 Cosmos 世界模型開發平台、Drive AV 軟體、Isaac AI 機器人開發平台和 Metropolis 智慧城市框架中使用的真實和合成資料來預訓練、測試、驗證和微調基礎模型。
該資料集的初始版本可在 Hugging Face 上獲得,提供 15 TB 的資料用於機器人訓練,並計劃在不久的將來支援自動駕駛汽車開發。
此外,Nvidia 宣布推出 Isaac GROOT N1,這是一個用於人形機器人的基礎模型。它在真實和合成資料上進行訓練,代表了 Project GROOT 的進展。
擴展 AI 視野
Nvidia 的戰略舉措展示了 AI 未來的清晰願景,將其影響力擴展到雲端之外,並深入到企業和實體世界的核心。透過結合尖端硬體、創新軟體平台和對開發者賦能的承諾,Nvidia 正在將自己定位為下一波 AI 創新的驅動力。推理能力的引入,加上實體 AI 工具和資料集的開發,標誌著朝著 AI 無縫融入我們日常生活、改變產業和重新定義我們與技術互動方式的未來邁出了重要一步。對企業解決方案、邊緣運算和機器人技術的關注突顯了 Nvidia 對 AI 領域多樣化和不斷發展的需求的理解,鞏固了其在這一變革性技術革命中的領導者地位。