Nvidia 推理模型與 AI Agent 建構基石 | zh-TW

Llama Nemotron 的崛起：強化推理能力，打造更智慧的 AI

Nvidia 策略的核心是推出 Llama Nemotron 系列 AI 模型。這些模型顯著增強了推理能力，標誌著在追求更複雜 AI 的道路上邁出了重要一步。Nemotron 系列基於 Meta Platforms Inc. 的開源 Llama 模型構建，旨在為開發人員提供創建進階 AI Agent 的堅實基礎。這些 Agent 被設想為在最少的人工監督下執行任務，代表著 AI 自主性的重大進步。

Nvidia 通過精心的訓練後增強功能實現了這些改進。可以把它想像成一位已經很有技能的學生，並為他們提供專業輔導。這種「輔導」側重於提高模型在多步驟數學、編碼、複雜決策和整體推理方面的能力。根據 Nvidia 的說法，與原始 Llama 模型相比，準確度提高了 20%。但增強功能不僅限於準確性。推論速度（本質上是模型處理資訊並提供答案的速度）提高了五倍。這意味著可以處理更複雜的任務，同時降低營運成本，這是實際部署的關鍵因素。

Llama Nemotron 模型通過 Nvidia 的 NIM 微服務平台提供三種不同的大小：

Nano： 專為部署在處理能力有限的設備上而設計，例如個人電腦和邊緣設備。這為 AI Agent 在資源受限的環境中運作開闢了可能性。
Super： 針對在單個圖形處理單元 (GPU) 上執行進行了優化。這在效能和資源需求之間提供了平衡。
Ultra： 專為實現最佳效能而設計，需要多個 GPU 伺服器。這適用於需要最高 AI 能力的應用。

優化過程本身利用了 Nvidia DGX Cloud 平台，利用來自 Nvidia Nemotron 的高品質合成數據，以及 Nvidia 自己策劃的數據集。為了促進透明度和協作，Nvidia 正在公開這些數據集、使用的工具以及其優化技術的詳細資訊。這種開放的方法鼓勵更廣泛的 AI 社群在 Nvidia 的工作基礎上再接再厲，並開發他們自己的基礎推理模型。

Llama Nemotron 的影響已經在 Nvidia 建立的合作夥伴關係中顯而易見。Microsoft Corp. 等主要參與者正在將這些模型整合到他們的雲端服務中。

Microsoft 正在其 Azure AI Foundry 服務上提供這些模型。
對於使用 Azure AI Agent Service for Microsoft 365 創建新 Agent 的客戶，它們也將作為一個選項提供。
SAP SE 正在利用 Llama Nemotron 來增強其 AI 助理 Joule 及其更廣泛的 SAP Business AI 解決方案組合。
其他知名公司，包括 Accenture Plc、Atlassian Corp.、Box Inc. 和 ServiceNow Inc.，也在與 Nvidia 合作，為其客戶提供對這些模型的訪問權限。

超越模型：Agentic AI 的全面生態系統

Nvidia 明白，構建 AI Agent 不僅需要強大的語言模型。還需要一個完整的生態系統，包括基礎設施、工具、數據管道等等。該公司正在通過一套額外的 Agentic AI 建構基石來滿足這些需求，這些建構基石也在 GTC 2025 上宣布。

Nvidia AI-Q Blueprint：將知識與行動聯繫起來

此框架旨在促進知識庫和 AI Agent 之間的連接，使它們能夠自主行動。該藍圖使用 Nvidia NIM 微服務構建並與 Nvidia NeMo Retriever 集成，簡化了為 AI Agent 檢索多模態數據（各種格式的資訊，如文本、圖像和音頻）的過程。

Nvidia AI Data Platform：優化推理的數據流

這個可定制的參考設計正在提供給主要的儲存供應商。目標是協助 Dell Technologies Inc.、Hewlett Packard Enterprise Co.、Hitachi Vantara、IBM Corp.、NetApp Inc.、Nutanix Inc.、Vast Data Inc. 和 Pure Storage Inc. 等公司開發專門針對 Agentic AI 推理工作負載的更高效數據平台。通過將優化的儲存資源與 Nvidia 的加速計算硬體相結合，開發人員可以期望在 AI 推理方面獲得顯著的效能提升。這是通過確保資訊從數據庫到 AI 模型的順暢和快速流動來實現的。

增強的 Nvidia NIM 微服務：持續學習和適應性

Nvidia 的 NIM 微服務已更新，以優化 Agentic AI 推理，支持持續學習和適應性。這些微服務使客戶能夠可靠地部署最新、最強大的 Agentic AI 模型，包括 Nvidia 的 Llama Nemotron 以及來自 Meta、Microsoft 和 Mistral AI 等公司的替代方案。

Nvidia NeMo 微服務：構建強大的數據飛輪

Nvidia 還在增強其 NeMo 微服務，該微服務為開發人員提供了一個框架，用於創建強大而高效的數據飛輪。這對於確保 AI Agent 能夠根據人類生成和 AI 生成的反饋不斷學習和改進至關重要。

戰略合作夥伴關係：推動整個 AI 領域的創新

Nvidia 對 Agentic AI 的承諾延伸到其與其他行業領導者的合作。

擴大與 Oracle 的合作夥伴關係：Oracle Cloud Infrastructure 上的 Agentic AI

Nvidia 正在擴大與 Oracle Corp. 的合作，將 Agentic AI 功能引入 Oracle Cloud Infrastructure (OCI)。此次合作涉及將 Nvidia 的加速 GPU 和推理軟體整合到 Oracle 的雲端基礎設施中，使其與 Oracle 的生成式 AI 服務兼容。這將加速 OCI 上 AI Agent 的開發。Nvidia 現在通過 OCI 控制台原生提供 160 多個 AI 工具和 NIM 微服務。兩家公司還在努力加速 Oracle Database 23ai 平台上的向量搜索。

深化與 Google 的合作：增強 AI 訪問和完整性

Nvidia 還提供了有關其與 Google LLC 擴大合作的最新資訊，揭示了旨在改善 AI 及其底層工具訪問的幾項舉措。

一個關鍵亮點是 Nvidia 成為第一個利用 Google DeepMind 的 SynthID 的組織。該技術直接將數位浮水印嵌入到 AI 生成的內容中，包括圖像、影片和文本。這有助於保護 AI 輸出的完整性並打擊虛假資訊。SynthID 最初與 Nvidia 的 Cosmos World 基礎模型集成。

此外，Nvidia 還與 Google 的 DeepMind 研究人員合作，為 Nvidia GPU 優化 Gemma（一系列開源、輕量級 AI 模型）。兩家公司還在合作開展一項旨在構建具有抓取技能的 AI 機器人的計劃，以及其他項目。

Google 和 Nvidia 研究人員和工程師之間的合作正在解決廣泛的挑戰。從藥物發現到機器人技術，突出了其變革潛力。

更新於 2025-03-20

# Agent # Nvidia # Nemotron