最初的震顫:DeepSeek與效率幻象
今年稍早,中國的DeepSeek AI的出現震動了科技投資界。其看似突破性的方法,承諾以顯著降低的計算開銷提供強大的人工智能,立即引發了猜測。一種論述迅速形成:或許以大量採購專用晶片和系統為特徵的、持續且昂貴的AI基礎設施擴張即將減速。市場隨之反應,反映出一種信念,即成本效益型AI的新時代可能會大幅削減預期的支出熱潮。
然而,最近一次行業精英高層會議的見解描繪了一幅截然不同的景象。由Bloomberg Intelligence在New York召開的一場生成式AI會議表明,最初僅關注潛在成本節約的解讀忽略了更宏大的故事。該活動非但沒有預示支出放緩,反而強調了對更大AI容量近乎永不滿足的渴求。與會者的共識並非削減開支,而是如何在極度渴望菜單能更便宜的同時,設法滿足對智能系統呈指數級增長的胃口。
來自前線的聲音:對容量無法抑制的渴望
這場為期一天的活動匯集了開發者、策略師和投資者,討論始終圍繞著需求升級推動巨額投資的主題。Bloomberg Intelligence資深科技分析師、活動組織者之一的Mandeep Singh簡潔地捕捉了普遍的情緒。回顧眾多小組討論和專家見解,他注意到一個普遍的聲音:沒有任何參與者覺得自己擁有足夠的AI容量。壓倒性的感覺是需要更多,而不是擁有太多。
至關重要的是,Singh補充道,在快速擴張的科技領域中常見的對’基礎設施泡沫’的恐懼,在這次對話中明顯缺席。焦點仍然牢牢地放在整個行業面臨的基礎性挑戰上。Singh的同事、Bloomberg Intelligence的IT服務與軟體資深分析師Anurag Rana將其描述為最重要的問題:’我們處於那個[AI基礎設施建設]週期的哪個階段?’
雖然承認要精確定位這個大規模建設的確切階段仍然困難(Rana承認,’沒有人’確切知道),但DeepSeek現象無疑改變了人們的觀點。它注入了一劑強心針,讓人們希望重要的AI工作負載有可能更經濟地處理。’DeepSeek震驚了很多人’,Rana觀察到。其含義很清楚:如果複雜的AI模型確實可以在要求較低的硬體上高效運行,那麼像傳聞中由主要科技公司組成的財團計劃的數千億美元級別的龐大項目,或許會被重新評估或以不同規模進行。
根據Rana的說法,整個行業的夢想是,AI運營成本,特別是inference(訓練好的模型生成預測或內容的階段)的成本,能夠遵循過去十年雲計算存儲所見證的急劇下降軌跡。他回憶起在Amazon Web Services (AWS)等平台上存儲大量數據的經濟性在大約八年內如何顯著改善。’成本曲線的下降……經濟效益很好’,他表示。’這正是每個人所希望的,在inference方面……如果曲線下降到那個水平,哦我的天,AI的採用率……將會非常驚人。’ Singh表示贊同,指出DeepSeek的到來從根本上’改變了每個人對實現效率的心態’。
這種對效率的渴望在整個會議期間顯而易見。雖然許多小組討論深入探討了將企業AI項目從概念階段推向實際生產的實用性,但一個平行的討論不斷強調大幅削減部署和運行這些AI模型相關成本的迫切需求。目標很明確:通過使AI在經濟上對更廣泛的應用和用戶可行,來普及化存取。Bloomberg自身的首席技術專家Shawn Edwards表示,DeepSeek不一定是個完全的意外,而是一個普遍願望的有力例證。’它讓我想的是,如果你能揮動魔杖讓這些模型運行得極其高效,那將會很棒’,他評論道,並將這個願望擴展到所有AI模型,而不僅僅是某一個特定的突破。
擴散原則:助長計算需求
儘管追求效率,專家預計AI基礎設施將持續進行大量投資的主要原因之一,在於AI模型的純粹擴散。在New York會議期間反覆出現的一個主題是,果斷地摒棄了單一、龐大的AI模型能夠處理所有任務的觀念。
- 一個家族事務: 正如Bloomberg的Edwards所說,’我們使用一個模型家族。不存在所謂的最佳模型。’ 這反映了一種日益增長的理解,即不同的AI架構在不同的任務上表現出色——語言生成、數據分析、圖像識別、代碼補全等等。
- 企業客製化: 與會者普遍認為,雖然大型、通用的’基礎’或’前沿’模型將繼續由主要AI實驗室開發和完善,但企業內部的實際行動涉及部署可能數百甚至數千個專門化的AI模型。
- 微調與專有數據: 許多這些企業模型將通過稱為fine-tuning的過程從基礎模型改編而來。這涉及在公司特定的、通常是專有的數據上重新訓練一個預訓練的神經網絡。這使得AI能夠理解獨特的業務背景、術語和客戶互動,提供比通用模型遠為相關和有價值的結果。
- 開發民主化: 代表數據科學平台Dataiku的Jed Dougherty強調了企業AI代理需要’模型間的可選性’。他強調了賦予公司對其AI工具的控制權、創建能力和可審計性的重要性。’我們希望將構建這些東西的工具交到人們手中’,Dougherty斷言。’我們不希望由十個博士來構建所有的代理。’ 這種推動更廣泛開發可及性的趨勢本身就意味著需要更多的底層基礎設施來支持這些分散的創建工作。
- 品牌特定AI: 創意產業提供了一個典型的例子。領導Adobe新業務創投的Hannah Elsakr解釋了他們將客製化模型作為關鍵差異化因素的策略。’我們可以為您的品牌訓練客製化的模型擴展,這有助於新的廣告活動’,她舉例說明,展示了如何量身定制AI以維持特定的品牌美學和訊息傳遞。
除了模型的多樣化,在企業工作流程中日益增加的AI agents部署是處理需求的另一個重要驅動因素。這些代理被設想為不僅僅是被動工具,而是能夠執行多步驟任務的主動參與者。
負責Microsoft Copilot Studio代理和自動化工作的Ray Smith預測,未來用戶將通過像Copilot這樣的統一界面與可能數百個專門化的代理互動。’你不會把整個流程塞進一個代理,你會把它分解成幾個部分’,他解釋道。他建議,這些代理本質上是編程’新世界中的應用程式’。其願景是,用戶只需陳述他們的目標——‘告訴它我們想完成什麼’——代理就會協調必要的步驟。’代理式應用程式只是一種新的工作流程方式’,Smith表示,強調實現這一願景與其說是技術可能性問題(’這在技術上都是可能的’),不如說是’我們構建它的速度’問題。
這種將AI代理更深入地嵌入日常組織流程的推動力,進一步加劇了降低成本和高效部署的壓力。微處理器巨頭ARM Holdings的產品管理負責人James McNiven從可及性的角度闡述了這一挑戰。’我們如何在越來越多的設備上提供存取權限?’他思考道。觀察到模型在特定任務上達到近乎’博士級’的能力,他將其與多年前將移動支付系統引入發展中國家的變革性影響相提並論。核心問題仍然是:’我們如何將那種[AI能力]提供給能夠使用該能力的人?’ 要讓複雜的AI代理作為助手廣泛提供給大量勞動力,不僅需要巧妙的軟體,還需要高效的硬體,並且不可避免地需要更多的底層基礎設施投資,即使每次計算的效率有所提高。
擴展障礙:晶片、電力與雲端巨頭
即使是使用最廣泛、最通用的基礎模型,其數量也在以驚人的速度增長,給現有基礎設施帶來巨大壓力。負責Amazon Web Services (AWS)計算和網絡的Dave Brown透露,僅他們的平台就為客戶提供了大約1,800種不同的AI模型。他強調AWS極度專注於’做很多事情來降低’運行這些強大工具的成本。
像AWS這樣的雲端供應商的一個關鍵策略是開發自己的客製化晶片。Brown強調了AWS設計的晶片(如其為AI訓練優化的Trainium處理器)使用率的增加,他表示:’AWS使用的自家處理器比其他公司的處理器更多。’ 這種轉向專用、內部硬體的舉措旨在爭奪對性能和成本的控制權,減少對像Nvidia、AMD和Intel這樣通用晶片供應商的依賴。儘管做出了這些努力,Brown坦率地承認了基本現實:’如果成本更低,客戶會做得更多。’ 目前需求的上限更多地是由預算限制定義的,而不是缺乏潛在應用。
領先AI開發商所需的資源規模是巨大的。Brown提到AWS每天都與Anthropic(複雜的Claude系列語言模型的創建者)合作。Anthropic的應用程式介面負責人Michael Gerstenhaber與Brown一同發言時指出,現代AI的計算密集度很高,特別是那些為複雜推理或’思考’而設計的模型。這些模型通常會為其答案生成詳細的逐步解釋,消耗大量的處理能力。’思考型模型導致大量容量被使用’,Gerstenhaber表示。
雖然Anthropic積極與AWS合作進行優化技術,如**’prompt caching’**(儲存和重用先前互動的計算以節省資源),但基本的硬體需求仍然龐大。Gerstenhaber直言不諱地表示,Anthropic需要’數十萬個加速器’——專用的AI晶片——分佈在’許多數據中心’,才能僅僅運行其當前的模型套件。這提供了一個具體的概念,即僅一個主要的AI參與者就需要多大規模的計算資源作為支撐。
除了採購和管理龐大晶片隊伍的挑戰之外,與AI相關的能源消耗急劇上升也是一個問題。Brown強調這是一個關鍵且迅速升級的擔憂。目前支持密集AI工作負載的數據中心已經在消耗以數百兆瓦計的電力。預測表明,未來的需求將不可避免地攀升至千兆瓦級別——相當於大型發電廠的輸出功率。’它消耗的電力’,Brown在談到AI時警告說,’是巨大的,而且在許多數據中心的佔地面積也很大。’ 這種不斷升級的能源需求不僅帶來巨大的運營成本,而且對下一代AI基礎設施的選址和供電提出了重大的環境和後勤挑戰。
經濟的未知數:籠罩增長計劃的陰影
儘管技術進步和新興用例推動了樂觀的前景,但一個重要的變數籠罩著所有AI投資的預測:更廣泛的經濟氣候。隨著Bloomberg Intelligence會議的結束,與會者已經觀察到市場因新宣布的全球關稅方案而出現的緊張情緒,這些方案被認為比預期的範圍更廣。
這有力地提醒我們,宏大的技術路線圖可能會被宏觀經濟的逆風迅速打亂。Bloomberg的Rana警告說,雖然AI支出最初可能在一定程度上受到保護,但企業IT投資的傳統領域,如與AI無關的伺服器和存儲,可能在經濟收縮中首當其衝。’我們關注的另一件大事是非AI技術支出’,他指出,表達了對主要科技服務提供商在進入財報季時可能受到的影響的擔憂,甚至在考慮AI預算之前。
然而,有一種普遍的理論認為,AI可能具有獨特的韌性。Rana建議,大型企業的首席財務官(CFOs)在面臨經濟不確定性甚至衰退導致的預算限制時,可能會選擇優先考慮AI計劃。他們可能會將資金從不太關鍵的領域轉移出來,以保護被視為對未來競爭力至關重要的戰略性AI投資。
然而,這種樂觀的看法遠非定論。根據Rana的說法,最終的考驗將是大型企業是否會在日益加劇的經濟不確定性面前,維持其積極的資本支出目標,特別是建設AI數據中心的目標。關鍵問題仍然是:’他們會不會說,’你知道嗎?太不確定了。’’ 答案將決定AI基礎設施支出看似不可阻擋的勢頭是繼續其無情的攀升,還是面臨由全球經濟現實決定的意外停頓。