駕馭推論革命
Nvidia 執行長黃仁勳在加州聖荷西舉行的年度軟體開發者大會上發表演說,強調 Nvidia 在人工智慧產業重大轉型中的強勢地位。他強調,產業正持續從 AI 模型的訓練階段轉向推論階段,企業越來越注重從這些模型中提取詳細、可操作的見解。
解決投資者疑慮和市場動態
黃仁勳身穿他標誌性的黑色皮夾克和牛仔褲發表演講,為 Nvidia 在高風險 AI 晶片市場的主導地位辯護。最近,由於中國的 DeepSeek 等競爭對手可能用更少的 AI 晶片實現類似的聊天機器人性能,引發了投資者的擔憂,給 Nvidia 看似不可撼動的領先地位蒙上了一層陰影。
儘管黃仁勳的演講充滿信心,但市場反應卻帶有一絲懷疑。Nvidia 的股價下跌了 3.4%,反映了晶片指數的整體下跌(收盤下跌 1.6%)。這種反應表明,市場可能已經消化了大部分預期消息,反映出對 Nvidia 長期策略採取「觀望」態度。
消除誤解並強調計算需求
黃仁勳直接反駁了他認為普遍存在的對 AI 不斷變化的計算需求的誤解。他大膽地表示:「幾乎整個世界都錯了」,強調先進 AI 應用所需的計算能力呈指數級增長,特別是在「Agentic AI」領域。
Agentic AI 的特點是自主代理能夠在最少的人工干預下執行日常任務,需要顯著提高的處理能力。黃仁勳估計,Agentic AI 和推理的計算需求「比我們去年這個時候認為需要的量高出 100 倍」。這種急劇增長突顯了對高性能計算解決方案持續且可能被低估的需求。
訓練與推論的二分法
Nvidia 目前面臨的挑戰關鍵在於 AI 市場不斷變化的動態。該行業正從主要關注訓練(使用大量數據集為聊天機器人等 AI 模型注入智慧)轉向推論。推論是訓練好的模型利用其獲取的知識為用戶提供特定答案和解決方案的階段。
這種轉變對 Nvidia 來說可能是一個潛在的阻力,因為其最賺錢的晶片傳統上是針對計算密集型訓練階段進行優化的。雖然 Nvidia 在過去十年中培養了一個強大的軟體工具和開發者支持生態系統,但去年為其帶來大部分收入(總計 1305 億美元)的是數據中心晶片,其價格高達數萬美元。
維持動力:三年飆升及未來
Nvidia 的股價在過去三年中實現了驚人的增長,漲幅超過四倍。這種顯著的增長得益於該公司在推動包括 ChatGPT、Claude 和許多其他複雜 AI 系統出現方面的關鍵作用。該公司的硬體已成為尖端 AI 開發的代名詞。
然而,要保持這種勢頭,就需要適應以推論為中心的市場不斷變化的需求。雖然建立在 Nvidia 晶片之上的 AI 產業的長期願景仍然引人注目,但短期投資者的預期對推論革命帶來的直接挑戰和機遇更為敏感。
揭示下一代晶片:Blackwell Ultra 及其他
黃仁勳利用這次會議作為平台,宣布了一系列新的晶片發布,旨在鞏固 Nvidia 在不斷發展的 AI 格局中的地位。其中一項宣布是推出 Blackwell Ultra GPU 晶片,計劃於今年下半年發布。
與其前身(當前一代的 Blackwell 晶片)相比,Blackwell Ultra 擁有增強的記憶體容量。這種增加的記憶體使其能夠支持更大、更複雜的 AI 模型,滿足先進 AI 應用不斷增長的需求。
雙重關注:響應能力和速度
黃仁勳強調,Nvidia 的晶片旨在解決 AI 性能的兩個關鍵方面:響應能力和速度。這些晶片必須使 AI 系統能夠對大量用戶查詢提供智慧響應,同時以最小的延遲提供這些響應。
黃仁勳認為,Nvidia 的技術在兩個領域都具有獨特的優勢。他將其與網路搜尋進行了類比,指出:「如果你回答問題的時間太長,客戶就不會再回來了。」這種類比強調了速度和效率在 AI 驅動的應用程式中保持用戶參與度和滿意度的重要性。
未來路線圖:Vera Rubin 和 Feynman
除了 Blackwell Ultra,黃仁勳還簡要介紹了 Nvidia 未來的晶片路線圖,透露了即將推出的 Vera Rubin 系統的詳細資訊。Vera Rubin 計劃於 2026 年下半年發布,旨在取代 Blackwell,提供更快的速度和增強的功能。
更進一步,黃仁勳宣布 Rubin 晶片之後將推出 Feynman 晶片,預計將於 2028 年問世。這種多代路線圖展示了 Nvidia 對持續創新的承諾,以及其在快速發展的 AI 硬體市場保持技術領先地位的決心。
應對行業挑戰和 Blackwell 的推出
這些新晶片的推出正值 Blackwell 的市場進入速度慢於最初預期之際。據報導,一個設計缺陷導致了製造挑戰,加劇了延遲。這種情況反映了更廣泛的行業困境,因為傳統的將不斷擴大的數據集輸入充滿 Nvidia 晶片的大型數據中心的方法已經開始顯示出回報遞減的趨勢。
儘管存在這些挑戰,Nvidia 上個月報告稱 Blackwell 的訂單「驚人」,表明儘管最初受挫,但對新晶片的需求強勁。
擴展生態系統:DGX 工作站和軟體創新
除了核心晶片公告外,黃仁勳還推出了一款基於 Blackwell 晶片的強大新型個人電腦 DGX Workstation。這款工作站將由戴爾、聯想和惠普等領先公司製造,對 Apple 的一些高端 Mac 產品構成了挑戰。
黃仁勳自豪地展示了其中一款設備的主機板,並宣稱:「這才是 PC 應該有的樣子。」此舉表明 Nvidia 有意將其在高性能計算市場的影響力從數據中心擴展到專業工作站領域。
Dynamo:加速推理並與通用汽車合作
在軟體方面,黃仁勳宣布發布 Dynamo,這是一款旨在加速 AI 應用程式推理過程的新軟體工具。Dynamo 是免費提供的,旨在促進更廣泛的採用並加速該領域的創新。
此外,黃仁勳透露與通用汽車建立了重要的合作夥伴關係,選擇 Nvidia 為其自動駕駛汽車車隊提供動力。此次合作凸顯了 Nvidia 在汽車行業日益增長的影響力,以及其對推進自動駕駛技術的承諾。這是一場備受矚目的勝利,它展示了 Nvidia 應用的多樣性。
前進的道路
Nvidia 對 AI 的未來寄予厚望,他們的持續創新是關鍵。他們認識到需要適應向推論的轉變,並且他們已經在開發可以同時執行這兩項任務的晶片。憑藉其成功的歷史以及對研發的承諾,Nvidia 很可能在未來幾年繼續成為 AI 產業的主要參與者。與主要技術和汽車公司的合作夥伴關係表明了 Nvidia 的發展方向。