微軟的深思熟慮:透過策略性耐心掌握 AI

在爭奪人工智能(AI)主導地位、成本高昂且風險極高的競賽中,傳統觀點往往認為引領潮流是通往勝利的唯一途徑。然而,深度參與生成式 AI 革命的巨頭 Microsoft,正選擇一條截然不同的道路。在 Microsoft AI CEO Mustafa Suleyman 的指導下,這家 Redmond 的龐然大物正欣然接受精明第二行動者的角色,讓其他公司開闢道路——並承擔驚人的成本——同時策略性地佈局,以利用他們的突破。這並非落後;這是一種關於效率、優化以及最終市場整合的深思熟慮的策略。

追隨領先者的經濟學

Mustafa Suleyman,自從他共同創立 DeepMind(後來被 Google 收購)以來,這個名字就與 AI 創新同義,他毫不避諱地闡述 Microsoft 的哲學。在近期的公開談話中,他揭示了其中的邏輯:刻意在 AI 模型開發的最前沿落後三到六個月,基本上更具成本效益。訓練真正’前沿’模型——那些推動 AI 能力極限的演算法——所涉及的資本密集度極高,耗資數十億美元,且無法保證立即的市場成功或適用性。

‘我們的策略是扮演一個緊密的第二名,考慮到這些模型的資本密集性’,Suleyman 坦率地表示。這種方法提供了關鍵的財務優勢。建立這些基礎模型需要龐大的數據集、大量高度專業化的工程師,以及最關鍵的,獲取巨大的計算能力儲備,主要由昂貴、耗能的 GPU 集群驅動。透過讓像 OpenAI 這樣的先驅——Microsoft 已對其投資數十億美元並提供大量雲端基礎設施的公司——處理最初、風險最高的開發階段,Microsoft 有效地外包了相當一部分的研發負擔和財務賭注。

然而,這個時間上的緩衝不僅僅是為了省錢。Suleyman 強調,額外的幾個月為 Microsoft 提供了寶貴的時間來精煉和優化這些強大的技術,以應用於具體、實際的客戶應用。前沿模型通常以強大但略顯通用的工具形式出現。Microsoft 的策略使其能夠觀察哪些有效,理解新興能力,然後直接根據其龐大的企業和消費者基礎的需求來定制實施方案。這種焦點從純粹的技術實力轉向實際效用——將 AI 無縫整合到像 Windows、Office (Microsoft 365)、Azure 雲端服務及其蓬勃發展的 Copilot 助手套件等產品中。目標不僅僅是擁有最新的模型,而是擁有對現實世界任務最有用的迭代。這種以客戶為中心的優化本身就成為一種競爭優勢,從長遠來看,可能比絕對第一個衝過技術終點線更有價值。

OpenAI 共生關係:一種策略性依賴

Microsoft 當前的 AI 態勢與其和 OpenAI 之間深刻且多方面的關係密不可分。這不僅僅是一項被動投資;它是 Redmond AI 產品策略的基石。Microsoft 為 OpenAI 提供了巨量的 Azure 雲端計算資源,這是訓練和運行像 GPT 系列這樣模型的必要燃料。作為回報,Microsoft 獲得了將這些最先進模型整合到其自身生態系統中的特權訪問和授權權利。這種共生安排使得 Microsoft 能夠在其產品線中提供尖端的 AI 功能,而無需承擔從頭開始完全內部開發同等模型的全部前期成本和風險。

從 Microsoft 的角度來看,既然與 Sam Altman 在 OpenAI 的團隊合作可以直接獲取其勞動成果,為何要重複他們已經在進行的艱鉅努力和巨大開銷?這是一種務實的方法,利用了 OpenAI 專注的研究能力,同時讓 Microsoft 能夠集中精力於更廣泛的整合、平台建設和市場部署。Microsoft 的 Copilot 計劃的成功,將 AI 輔助注入從編碼到電子表格的各個方面,很大程度上建立在這個基礎之上。

然而,這種依賴,儘管具有策略性,自然也引發了關於長期獨立性的問題。雖然這種夥伴關係目前非常有利,但它代表了對一個外部實體的顯著依賴,儘管這個實體透過投資和基礎設施供應而緊密結盟。這種關係的動態是複雜且不斷演變的,塑造著整個 AI 行業的競爭格局。

分散風險:Phi 模型的崛起

雖然與 OpenAI 的合作關係構成了其高端 AI 產品的基石,但 Microsoft 並未將所有籌碼押在一個數字上。該公司正同時推行一條平行軌道,開發自己的、更小、更專業化的語言模型家族,代號為 Phi。這項計劃代表了其整體 AI 策略中一個不同但互補的方面。

與像 GPT-4 這樣龐大、通用的模型不同,Phi 系列模型被刻意設計得緊湊且高效。它們的參數數量通常在個位數到低兩位數十億之間,比它們的前沿對手小幾個數量級。這種較小的體積帶來了明顯的優勢:

  • 效率: 它們運行所需的計算能力顯著減少,使得大規模運營的成本大大降低。
  • 邊緣計算: 它們適度的資源需求使其適合部署在本地設備上,例如筆記型電腦甚至智能手機,而不僅僅依賴於強大的基於雲端的 GPU 集群。這為離線 AI 功能、增強的隱私和更低延遲的應用開闢了可能性。
  • 寬鬆授權: Microsoft 值得注意地在寬鬆授權(如 MIT 授權)下發布了許多 Phi 模型,透過像 Hugging Face 這樣的平台,讓更廣泛的研究和開發社群可以免費使用。這促進了創新,並允許外部開發者在 Microsoft 的工作基礎上進行構建。

雖然這些 Phi 模型通常不具備與 OpenAI 頂級產品相同的廣泛功能或原始性能基準(直到最近才缺乏在較大模型中發現的先進功能,如多模態或複雜的專家混合(Mixture of Experts)架構),但它們已被證明在其規模下表現得非常稱職。考慮到它們受限的參數數量,它們在特定任務上的表現往往遠超其體量級別,令人印象深刻。例如,像 Phi-4 這樣的模型,儘管相對較小,可能只有 140 億個參數,卻可以在單個高端 GPU 上有效運行,這對於體積大很多倍、通常需要裝滿 GPU 的整個伺服器的模型來說是不可能的壯舉。

Phi 家族的發展服務於多個策略目的。它為 Microsoft 提供了模型構建方面的內部專業知識,減少了對外部合作夥伴在某些類型應用上的依賴,滿足了對高效邊緣 AI 日益增長的需求,並在開源社群中培養了良好聲譽。這是一種對沖,一條替代路徑,也可能是一個邁向更大 AI 自主性的墊腳石。

長遠眼光:邁向自給自足

儘管當前的’快速跟隨者’策略行之有效,且與 OpenAI 深度整合,但 Mustafa Suleyman 對於 Microsoft 的最終抱負非常明確:長期的 AI 自給自足。他毫不含糊地闡述了這一願景,表示:’從長遠來看,我們能夠在 Microsoft 內部實現 AI 自給自足,這絕對是至關重要的任務。’ 這表明,目前對合作夥伴的依賴,無論現在多麼有利,都被視為一個過渡階段,而非永久狀態。

實現這一目標將需要在研究、人才引進和基礎設施開發方面持續、大量的內部投資,並建立在像 Phi 模型家族這樣的項目所奠定的基礎之上。這意味著要發展涵蓋整個 AI 技術棧的能力,從基礎模型創建到應用部署,潛在地與其目前所依賴的合作夥伴相匹敵。

然而,這種轉變並非迫在眉睫。Suleyman 本人也緩和了預期,指出現有關鍵夥伴關係的長期性:’至少在 2030 年之前,我們都與 OpenAI 深度合作,他們對我們來說一直是非常成功的關係。’ 這個時間表表明,這將是一個漸進的、多年的演變,而不是突然的轉變。未來五到六年,Microsoft 很可能會繼續利用 OpenAI 的進展,同時增強自身的內部實力。

背景因素也發揮了作用。當 OpenAI 宣布與 Oracle 和 Softbank 進行合作時,引發了對 Microsoft-OpenAI 雲端關係排他性的擔憂,這表明 Microsoft 將不再是該 AI 研究實驗室的唯一雲端提供商。雖然核心夥伴關係依然牢固,但這些發展突顯了在快速變化的 AI 格局中聯盟的動態性,並可能強化了 Microsoft 培養獨立能力的策略必要性。通往自給自足的道路是一項長期的策略目標,需要在當前優勢與未來獨立性之間取得平衡。

更廣泛的趨勢:跟隨者群體

Microsoft 這種策略性跟隨的深思熟慮方法並非孤立現象。推動 AI 絕對前沿所固有的巨大成本和不確定性,已導致其他主要科技公司採取類似但各有不同的策略。這表明,成為’快速跟隨者’正在成為生成式 AI 領域中一種公認且可行的策略。

Amazon Web Services (AWS) 提供了一個引人注目的平行案例。就像 Microsoft 與 OpenAI 的關係一樣,AWS 已對 Anthropic 投入巨資(數十億美元),後者是 OpenAI 的著名競爭對手,以其 Claude 系列模型而聞名。AWS 提供了大量的雲端計算資源,包括像其 Project Rainier 集群這樣的專用基礎設施,將 Anthropic 定位為其平台上的關鍵合作夥伴。與此同時,AWS 正在開發自己的語言模型家族,據報導代號為 Nova。然而,與 Microsoft 對 Phi 相對開放的做法不同,AWS 似乎將 Nova 保持為專有,主要將其整合到自己的生態系統和服務中。這反映了跟隨者策略:利用領先的合作夥伴,同時建立內部能力,儘管與 Microsoft 的開源貢獻相比,其方法更為封閉。

這一趨勢超越了矽谷。中國的科技巨頭也展現了對這種策略的熟練運用。Alibaba 透過其 Qwen 團隊獲得了顯著關注。Qwen 模型家族,很像 Microsoft 的 Phi,以其性能常常超出同等規模模型的預期而聞名。它們不一定在技術上開創了全新的領域,但在快速迭代和優化他人開創的概念方面表現出色。例如,在 OpenAI 普及了先進推理能力的概念後,Qwen 團隊相對迅速地發布了包含這些能力的模型,專注於在已建立的範式內實現效率和性能。Alibaba,與 Microsoft 類似,也採取了相對開放的態度,向公眾發布了許多 Qwen 模型。

同樣,DeepSeek,另一個中國 AI 實體,展示了專注迭代的力量。一旦以推理為中心的語言模型的概念被先驅者驗證,DeepSeek 就集中精力優化這些架構,顯著降低了訓練和運行此類模型的計算需求。這使得他們能夠提供能力強大但資源消耗相對較少的模型,憑藉效率和可及性開闢了一個利基市場。

這些例子說明,’快速跟隨者’策略正在全球範圍內被採用。公司觀察突破,從先驅者的成功和失誤中學習,然後將資源集中於優化、精煉和整合這些進展,以最適合其特定市場地位、客戶基礎和商業模式的方式進行。它承認,在一個需要如此龐大資源的領域,策略性模仿和適應可能與持續創新同樣強大,而且經濟得多。

超越模型:構建 AI 生態系統

Microsoft 策略的一個關鍵、常被低估的優勢是資源和焦點的釋放。透過不將每一分可用資金和每一位工程師都投入到爭奪下一個突破性基礎模型的競賽中,Microsoft 可以將大量精力投入到可能是廣泛 AI 應用最關鍵的挑戰上:構建周邊生態系統並實現實際應用

如果無法有效地整合到現有的工作流程、業務流程和軟體產品中,世界上最強大的 AI 模型價值也有限。認識到這一點,Microsoft 一直在努力開發所需的工具、框架和基礎設施,以彌合原始 AI 能力與實際商業價值之間的鴻溝。這種對 AI 實施’最後一哩路’的關注,可以說是 Microsoft 在企業軟體和雲端平台方面的優勢提供顯著競爭優勢的地方。

幾個關鍵舉措突顯了這一焦點:

  • Autogen: 這個框架旨在簡化涉及多個 AI 代理協同工作的應用程序的創建和編排。複雜任務通常需要將其分解為由專門的 AI 代理處理的子任務;Autogen 提供了有效管理這些交互的結構。
  • KBLaM (Knowledge Base Language Model): 已宣布的研究專注於降低使用結構化外部數據源(如數據庫)來增強語言模型知識所相關的計算成本和複雜性。這對於企業應用至關重要,因為在這些應用中,AI 需要準確高效地基於特定的公司數據進行推理。
  • VidTok: 這個最近推出的開源視頻分詞器旨在標準化將視頻內容轉換為機器學習模型可以輕鬆處理和理解的格式的方式。隨著 AI 越來越多地處理多模態任務(文本、圖像、視頻),像 VidTok 這樣的工具成為構建複雜視頻感知應用的基礎設施。

這些只是更廣泛努力的例子。Microsoft 正在穩步發布研究論文、軟體庫和平台功能,旨在使 AI 整合對開發者和企業來說更容易、更高效、更可靠。透過在發展 Phi 模型和與 OpenAI 合作的同時專注於這些賦能技術,Microsoft 不僅在構建 AI 模型,而且在構建一個全面的平台,旨在使其龐大的客戶群能夠接觸、管理並真正有效地使用 AI。這種對應用和整合的策略性強調,得益於在尖端模型開發中作為’快速跟隨者’所節省的成本,最終可能成為長期 AI 競賽中的決定性因素。