2025年初,中國團隊 DeepSeek 推出 DeepSeek-R1,在人工智慧領域引發了一場地震。這個開源的、擁有 6710 億參數的語言模型迅速確立了其強大的競爭力,在數學、程式設計和邏輯推理等關鍵領域可與 OpenAI 的領先模型相媲美。DeepSeek-R1 由於使用了強化學習,解決複雜問題的能力尤其值得注意。該模型的 MIT 許可證進一步打破了商業壁壘,顛覆了整個格局。DeepSeek-R1 的首次亮相震動了整個科技界,甚至影響了金融市場,據報導,在其發布後的一周內,人工智慧股票大幅下跌。
DeepSeek-R1 標誌著中國開源人工智慧運動在高端語言模型領域取得了顯著的飛躍。這項突如其來的挑戰刺激了來自美國和中國的全球人工智慧領導者加速其行動,揭示了他們在技術和市場定位方面的策略。這場圍繞 DeepSeek-R1 模型展開的人工智慧競賽已經開始。
讓我們來檢視一下人工智慧領域的主要參與者——Meta、Google、OpenAI、Anthropic、阿里巴巴和百度——如何應對這項新的競爭。
Meta:利用 LLaMA 4 的規模和效率
Meta 作為開源模型社群的領跑者,透過推出 LLaMA 4 來回應 DeepSeek R1。2025 年 4 月,Meta 推出了 LLaMA 4,這是迄今為止最強大的模型,並透過 Cloudflare 等平台提供 API 存取。LLaMA 4 使用混合專家 (Mixture-of-Experts, MoE) 架構,該架構將模型劃分為子模型,並且在每次推理期間僅啟動其中的一小部分。這種設計在大型參數與推理效率之間取得了平衡。
LLaMA 4 系列包含多個子模型,包括 “Scout”,總共有 1090 億個參數,但只有 170 億個活動參數,使其可以在單個 H100 卡上運行。”Maverick” 模型有 4000 億個總參數(128 個專家),但仍然只有 170 億個活動參數,需要一個 DGX 集群。這種設計使 LLaMA 4 能夠支援高達 1000 萬個 tokens 的上下文視窗,使其成為首批提供此功能的開源模型之一。這對於總結長文件和分析大型程式碼儲存庫特別有用。
由於其 MoE 架構,LLaMA 4 保持了快速的響應時間,並支援圖像、音訊和視訊的多模態輸入。Meta 選擇了一種效率策略,加強了其多模態能力並簡化了其營運,以鞏固其在開源領域的地位,而 DeepSeek 則專注於推理能力。
Google:Gemini 朝向自主智慧代理的演進
面對來自 OpenAI 和 DeepSeek 的雙重壓力,Google 選擇了一種技術創新策略。2025 年 2 月,Google 推出了 Gemini 2.0 系列,包括 Flash、Pro 和 Lite 版本,標誌著朝向 “智慧代理” 能力的發展。
Gemini 2.0 的代理能力代表了一項重大進展。該模型可以理解多種模態,並主動使用搜尋引擎、程式碼沙箱和網路瀏覽。Google 的 Project Mariner 允許 AI 驅動的 Chrome 瀏覽器操作,使 AI 能夠填寫表單並點擊按鈕。
為了支援其代理生態系統,Google 還推出了 Agent2Agent 協定,該協定允許不同的智慧代理進行通訊和協同工作。此外,它還創建了 Agent Garden,這是一個工具和開發工具包,旨在鼓勵第三方開發人員參與。
Google 正在重新定義下一個時代的核心場景,專注於智慧代理協作,因為 AI 正朝著基於工具和自主能力的方向發展,而不是專注於與 DeepSeek 和 OpenAI 的參數競賽。Gemini 的演進代表了一種策略轉變,而不僅僅是模型的升級。
OpenAI:迭代模型並整合生態系統以實現可靠性和領導地位
OpenAI 加快了其模型迭代和產品部署,以回應 DeepSeek R1。2025 年 2 月,OpenAI 推出了 GPT-4.5,這是 GPT-4 的一個臨時版本,它提高了邏輯一致性和事實準確性,同時也為 GPT-5 鋪平了道路。
GPT-4.5 被認為是不包含鏈式思維推理的最後一個主要模型。GPT-5 將結合實驗性推理模型 o3-mini 和 GPT 系列的功能,以創建一個統一的 “通用認知模型”。OpenAI 還表示,GPT-5 將具有高度可調的智慧水平和工具使用能力。
OpenAI 決定允許 ChatGPT 的免費使用者使用 GPT-5 的基本版本,而付費使用者將可以存取更進階的功能,以降低使用者切換到開源替代方案的風險。此策略旨在透過廣泛的覆蓋範圍讓使用者保持參與。
OpenAI 還將外掛程式、瀏覽器和程式碼執行器等功能整合到 GPT 核心模型中,而不是將它們分開,以創建一個 “功能齊全的人工智慧”。OpenAI 正在透過系統地整合和提高智慧密度來回應 R1 的挑戰。
Anthropic:透過混合推理和思維預算深化穩健智慧
Anthropic 在 2025 年 2 月推出了 Claude 3.7 Sonnet,該模型專注於 “混合推理” 和 “思維預算”。使用者可以選擇 “標準模式” 以獲得快速響應,或啟用 “擴展模式” 以進行更深入、逐步的思考。
這種方法類似於人們在面臨困難任務時的 “多思考”,因為它允許 AI 花費更長的時間進行推理,以提高準確性。Anthropic 還允許使用者設定 “思考時間”,以平衡推理深度和呼叫成本。
Claude 3.7 在程式設計和推理等具有挑戰性的任務中優於其前身 3.5,並且是業界少數幾個專注於推理過程透明度的模型之一。其程式碼能力在最近的評估中也取得了 70.3% 的準確性。
Claude 3.7 透過專注於創建具有可解釋、穩定和可自訂思維模式的模型,而不是追求參數堆疊,展示了 Anthropic 對 “可控智慧” 的承諾。Anthropic 正在以自己的步調穩步推進 R1 驅動的 “推理競賽”。
阿里巴巴:使用 Qwen 建立中國開源生態系統
阿里巴巴的達摩學院在 DeepSeek R1 發布後僅一周就迅速更新了其 Qwen 模型系列,於 2025 年 2 月發布了 Qwen 2.5 系列,並於 4 月底發布了新的 Qwen 3 系列,展示了強大的產品響應能力和策略眼光。
Qwen 3 系列包括參數範圍從 6 億到 2350 億的模型版本。它使用 MoE 架構來維持模型性能,同時使用更少的計算資源。旗艦模型 Qwen3-235B-A22B 僅需四個高效能 GPU 即可進行部署,透過最佳化啟動參數,大大降低了企業實施大型模型的門檻。在多個標準測試中,Qwen 3 的整體性能超過了 DeepSeek R1、OpenAI o1 和 Gemini 2.5 Pro 等頂級國際模型。
除了技術競爭力之外,阿里巴巴還非常重視建立開源生態系統。Qwen 3 在 Apache 2.0 許可證下完全開源,具有開放權重、訓練程式碼和部署工具,支援多語言(119 種語言)和多模態應用,目標是創建一個可以被全球開發人員直接使用和自訂的基礎模型。
阿里巴巴的 “技術 + 生態系統” 策略與 DeepSeek 的輕量級突破風格相輔相成。一個強調快速迭代和領先的推理,另一個強調生態系統建設以及平衡規模和多樣性。Qwen 正在逐漸將自己確立為國內開源大型模型的 “生態系統樞紐”,是對 DeepSeek 引起的行業破壞的穩定回應。
百度:透過 ERNIE Bot 的升級來增強多模態和外掛程式工具
百度在 3 月份大幅升級了其旗艦模型 ERNIE Bot,發布了 ERNIE Bot 4.5 和 ERNIE X1 以供公開測試。ERNIE X1 的定位是 “深度思考模型”,專注於增強 AI 理解、規劃和執行複雜任務的能力。
ERNIE 4.5 是百度首個原生多模態大型模型,支援文字、圖像、音訊和視訊的聯合建模。此版本還顯著減少了幻覺生成,並提高了程式碼理解和邏輯推理能力,在多個中文場景任務中超過了 GPT-4.5 水平。
百度正在建立一個更有用的 “AI 工具生態系統”。X1 模型可以使用搜尋、文件問答、PDF 閱讀、程式碼執行、圖像識別、網路存取和商業資訊查詢功能,真正實現 AI 的 “動手能力”,呼應了 Google Gemini 的代理路線。
百度還宣布,它將在 2025 年 6 月底之前開源 ERNIE 模型的一些參數,並進一步擴大與企業級客戶的應用整合。ERNIE 系列正在從一個閉環產品轉變為一個平台生態系統,透過 API 和外掛程式系統吸引開發人員和企業。
百度沒有直接與 R1 和 Qwen 在開源領域競爭,而是利用其在中文內容、搜尋服務和知識圖譜方面的深厚積累,將該模型與搜尋、辦公和資訊流等產品場景深度整合,創建一個更本地化的人工智慧產品組合。
總之,DeepSeek R1 的發布不僅僅是一項技術突破;它是全球人工智慧領域的催化劑。它迫使巨頭們提高推理性能,刺激國內公司爭奪開源,並促使美國公司加速開發代理、整合和多模態。
儘管中國和美國人工智慧巨頭的反應不同,但它們的目標是相同的:創建更強大、更可靠、更靈活的大型模型,並贏得技術、生態系統和使用者的三重競爭。這個過程遠未結束。隨著 GPT-5、Gemini 3、Claude 4,甚至是 DeepSeek R2 和 Qwen 4 的相繼發布,全球人工智慧正在進入一個 “螺旋式上升” 的新階段。
對於企業使用者和開發人員而言,這場競爭將帶來更多的選擇、更低的成本和更強大的大型模型工具。全球人工智慧能力正以空前的速度傳播和普及,下一個決定性的技術突破可能已經在路上。