推理革命:AI 計算的典範轉移
在 Nvidia 年度 GTC 大會上,CEO 黃仁勳接受 CNBC 的 Jim Cramer 採訪,闡述了中國初創公司 DeepSeek 的創新 AI 模型所帶來的深遠影響。與業界普遍的假設相反,黃仁勳強調,這個突破性的模型需要 更多 的計算能力,而不是更少。
黃仁勳稱讚 DeepSeek 的 R1 模型「非常出色」,強調它是「第一個開源推理模型」的先驅地位。他詳細介紹了該模型以逐步方式剖析問題、產生多種潛在解決方案並嚴格評估其答案正確性的獨特能力。
黃仁勳解釋說,這種推理能力是計算需求增加的關鍵。「這種推理 AI 比非推理 AI 消耗多 100 倍的計算量,」他強調說,這與業界普遍的預期形成鮮明對比。這一啟示挑戰了傳統觀念,即 AI 模型的進步總是會帶來更高的效率和更少的計算需求。
一月拋售:對創新的誤解
DeepSeek 模型於 1 月下旬亮相,引發了劇烈的市場反應。AI 股票遭遇大規模拋售,原因是投資者擔心該模型可以在消耗更少能源和財務資源的同時,實現與領先競爭對手相當的性能。Nvidia 作為 AI 晶片市場的主導力量,在一個交易日內暴跌 17%,市值蒸發近 6000 億美元,這是美國公司歷史上最大的單日跌幅。
然而,這種市場反應源於對該模型真實性質的誤解。雖然 DeepSeek 的 R1 模型確實代表了 AI 能力的重大飛躍,但其以推理為中心的方法需要大幅增加計算能力,這一事實最初被許多投資者忽視了。
Nvidia 的 GTC 大會:揭示 AI 基礎設施的未來
黃仁勳還利用這次採訪的機會,討論了 Nvidia 在其 GTC 大會上發布的一些重要公告。他說,這些公告強調了該公司致力於構建支持蓬勃發展的 AI 革命所需的基礎設施。
黃仁勳強調的重點領域包括:
機器人 AI 基礎設施: Nvidia 正在積極開發專門針對機器人應用獨特需求的 AI 基礎設施。這包括旨在加速各行業智能機器人開發和部署的硬體和軟體解決方案。
企業 AI 解決方案: 認識到 AI 對企業的變革潛力,Nvidia 正在與領先的企業技術供應商建立戰略合作夥伴關係。這些合作旨在將 Nvidia 的 AI 技術整合到企業工作流程中,提高生產力、效率和決策能力。
- Dell: Nvidia 正在與 Dell 合作,為企業提供強大的 AI 伺服器和工作站,這些伺服器和工作站針對各種 AI 工作負載進行了優化。
- HPE: 與 HPE 的合作重點是為 AI 提供高性能計算解決方案,使企業能夠應對複雜的 AI 挑戰。
- Accenture: Nvidia 正在與 Accenture 合作,幫助各行各業的企業採用和實施 AI 解決方案,利用 Accenture 的諮詢專業知識和 Nvidia 的技術平台。
- ServiceNow: 將 Nvidia 的 AI 功能與 ServiceNow 的平台集成,旨在自動化和優化 IT 服務管理,提高效率和用戶體驗。
- CrowdStrike: Nvidia 正在與 CrowdStrike 合作,利用 AI 增強網絡安全解決方案,實現更快、更有效的威脅檢測和響應。
AI 熱潮:從生成式模型到推理模型
黃仁勳還就更廣泛的 AI 領域發表了他的看法,他觀察到人們的關注點從純粹的生成式 AI 模型顯著轉向了包含推理能力的模型。
生成式 AI: 早期 AI 的浪潮專注於根據從現有數據中學習的模式創建新內容,例如文本、圖像和音頻。雖然令人印象深刻,但生成式 AI 模型通常缺乏推理、理解上下文或解決複雜問題的能力。
推理 AI: 像 DeepSeek 的 R1 這樣的推理模型的出現標誌著向前邁出了重要一步。這些模型可以分析信息、做出推論並以更像人類的方式解決問題,為 AI 應用開闢了新的可能性。
黃仁勳的見解強調了 AI 領域的動態特性,持續的創新推動了越來越複雜和強大的模型的發展。
萬億美元的機遇:AI 計算的未來
展望未來,黃仁勳預計全球計算資本支出將大幅增加,這主要是由 AI 不斷升級的需求推動的。他預計,到本世紀末,這些支出將達到驚人的一萬億美元,其中大部分用於與 AI 相關的基礎設施。
「因此,到本世紀末,我們在一萬億美元中所佔的機會比例相當大,」黃仁勳表示,強調了 Nvidia 在這個快速發展的領域中的巨大增長潛力。「我們有很多基礎設施需要建設。」
這一大膽的預測反映了 Nvidia 對 AI 變革力量的信心,以及其致力於提供將支撐這場革命的基礎技術。隨著 AI 模型的不斷進步,特別是在推理領域,對高性能計算基礎設施的需求將會飆升,為像 Nvidia 這樣處於這一技術前沿的公司創造前所未有的機會。
深入探討:DeepSeek 推理模型的重要性
為了充分理解黃仁勳言論的含義,深入了解 DeepSeek 的 R1 模型及其推理能力的本質至關重要。
什麼是推理模型?
與主要依賴模式識別和統計相關性的傳統 AI 模型不同,推理模型旨在模仿人類的認知過程。他們可以:
- 分析信息: 將複雜問題分解為更小、更易於管理的步驟。
- 做出推論: 根據現有證據做出邏輯推論。
- 評估解決方案: 評估潛在答案的有效性和正確性。
- 適應新信息: 根據新的輸入或反饋調整其推理過程。
這些能力使推理模型能夠解決傳統 AI 方法無法解決的問題。他們可以處理歧義、不確定性和不完整的信息,使其適用於更廣泛的實際應用。
為什麼推理需要更多計算?
推理模型計算需求的增加源於以下幾個因素:
- 多步驟處理: 推理涉及一系列相互關聯的步驟,每個步驟都需要計算資源。
- 探索多種可能性: 推理模型通常在得出最佳解決方案之前會探索多種潛在的解決方案。
- 知識表示: 推理模型需要複雜的方法來表示和操作知識,這可能需要大量的計算。
- 驗證和確認: 對解決方案的嚴格評估增加了計算負擔。
從本質上講,推理模型以計算效率換取增強的認知能力。他們優先考慮解決複雜問題的能力,而不是最小化資源消耗。
更廣泛的影響:對 AI 產業的影響
黃仁勳關於 DeepSeek 模型和 AI 計算未來的評論對該行業具有深遠的影響:
- 對專用硬體的需求增加: 推理模型的興起將推動對專用硬體(例如 GPU 和 AI 加速器)的需求,這些硬體可以有效地處理這些模型的計算需求。
- 關注 AI 基礎設施: 公司將需要大力投資 AI 基礎設施,以支持推理模型的開發和部署。
- AI 研究重點的轉變: DeepSeek 模型的成功可能會刺激對基於推理的 AI 方法的進一步研究。
- AI 應用的新機遇: 推理模型將為 AI 在科學發現、金融建模和醫學診斷等領域開闢新的可能性。
- 競爭與創新: 開發更強大、更高效的推理模型的競賽將加劇競爭並推動 AI 晶片市場的創新。
AI 領域正在迅速發展,黃仁勳的見解為我們提供了了解這項變革性技術未來的寶貴機會。推理模型的興起代表了一個重要的里程碑,為 AI 系統鋪平了道路,這些系統可以解決日益複雜的問題並開闢新的創新前沿。Nvidia 憑藉其對高性能計算和 AI 基礎設施的關注,完全有能力在這一激動人心的發展中發揮核心作用。該公司致力於建設「未來的基礎設施」,這強調了其對 AI 變革力量的信念,以及其重塑產業和重新定義可能性邊界的潛力。