中國開源的匯聚
二月初,中國開源大型模型 DeepSeek 在全球 140 個國家和地區的應用市場下載量名列前茅之際,OpenAI 公開指責 DeepSeek 未經許可使用 ChatGPT 的提煉數據。
這項指控非但沒有挽救 OpenAI 的聲譽,反而引來全球研究人員的廣泛嘲笑。
如今,另一位完全擁抱「提煉」buff 的競爭者出現了。
4 月 13 日,昆侖萬維推出了 Skywork-OR1 (Open Reasoner 1) 系列模型,在同等規模下超越了阿里巴巴的 Qwen-32B,並與 DeepSeek-R1 並駕齊驅。
昆侖萬維這家財力有限的公司,是如何創造出 SOTA 級別的大型模型的?官方解釋是,他們的模型基於 DeepSeek-R1-Distill-Qwen-7B 和 DeepSeek-R1-Distill-Qwen-32B。
顧名思義,DeepSeek 的模型提煉了阿里巴巴的 Qwen 系列模型。
在利用優秀開源模型的同時,昆侖萬維也在為開源社群做出貢獻。與 DeepSeek 僅開源模型權重不同,昆侖萬維還開源了其數據集和訓練程式碼,更符合「真正開源」的理念。這意味著任何用戶都可以嘗試複製他們的模型訓練過程。
昆侖萬維的成就展現了開源最重要的方面:它不僅為用戶提供免費且隨手可得的產品,還使更多開發人員能夠站在前人的肩膀上,快速且經濟高效地推進技術。
事實上,在去年業界討論大型模型預訓練瓶頸之際,中國大型模型的迭代速度今年有所加快,越來越多的公司投入開源。
阿里巴巴雲的通義千問在農曆除夕開源了其新的視覺模型 Qwen2.5-VL,並在 3 月初發布並開源了其新的推理模型 QwQ-32B,在開源當天就登上了全球主流 AI 開源社群 Hugging Face 的熱門榜首。
階躍智慧 (Stepwise) 然後在大約一個月的時間內開源了三個多模態大型模型,其中最新的是圖像轉影片模型 Step-Video-TI2V,該模型支援生成具有可控運動幅度和鏡頭移動的影片,並且還具有一定的特效生成功能。
智譜 (Zhipu) 在四月份宣布,將開源 32B/9B 系列 GLM 模型,涵蓋基礎、推理和沉思模型,所有模型均在 MIT 許可協議下。
甚至曾經封閉源碼的百度也宣布,將於 6 月 30 日全面開源文心 (Wenxin) 大型模型。
與國內開源生態系統日益繁榮相比,美國大型模型公司仍然主要關注封閉源碼,這為中國大型模型提供了難得的出海機會。DeepSeek 允許印尼教育公司 Ruangguru 以低成本優化其教學模型;新加坡 B2B 旅遊科技公司 Atlas 已將 Qwen 整合到其智慧客服系統中,以實現 24/7 全天候多語言支援。
為何美國封閉源碼,中國開源?
美國 AI 產業傾向於封閉源碼,而中國 AI 日益開放,這是兩國 AI 發展環境不同的必然結果。
美國 AI 產業主要由科技巨頭和創投 (VC) 領導,他們對 AI 的資本回報抱有巨大期望。因此,美國 AI 模型公司普遍對技術抱有堅定的信念,即追求技術領先,實現一定程度的市場壟斷,然後創造巨額利潤,他們的生態系統自然傾向於封閉源碼。
以 OpenAI 的發展歷史為例,它在成立之初是一家非營利實體,但此後變得越來越封閉。GPT-1 完全開源,GPT-2 部分開源並在完全開源之前遇到阻力,GPT-3 正式轉為封閉源碼,然後 GPT-4 進一步加強了封閉源碼策略,模型架構和訓練數據完全保密,甚至限制了企業用戶的 API 調用頻率。
雖然 OpenAI 表示關閉源碼是基於合規性和控制技術濫用,但市場普遍認為 OpenAI 轉向封閉源碼的里程碑事件是其與微軟達成千億美元合作,將 GPT-3 嵌入 Azure 雲服務以形成「技術-資本」閉環。
當微軟去年 10 月首次在其財務報告中披露其對 OpenAI 的投資時,它表示:「我們已投資 OpenAIGlobal, LLC,總投資承諾為 130 億美元,該投資採用權益法核算。」
所謂權益法也可以理解為,微軟對 OpenAI 的投資旨在獲得回報,而不是純粹的慈善研究。顯然,OpenAI 通過封閉源碼生態系統銷售高價 API 是其目前最大的收入來源,並且已成為 OpenAI 不願開源的最大障礙。
從 OpenAI 的「分裂」中誕生的 Anthropic 從一開始就決心採取封閉源碼路線,其大型模型產品 Claude 已完全採用封閉源碼模型。
即使是 META 在美國唯一的開源領導者 Llama,在開源時也增加了兩個反朋友條款:
- 在 META 批准之前,開源模型不能用於每月活躍用戶超過 7 億的產品和服務。
- Llama 模型的輸出內容不能用於訓練和改進其他大型語言模型。
可見,即使對於開源模型,Meta 的核心目的仍然是建立自己的 AI 生態系統,而不是技術包容性。
美國選擇了一種基於封閉源碼、以開源為補充的 AI 戰略,可以說是純粹的商業考量。相比之下,中國自上而下的頂層設計從一開始就重視開源,體現了一種在獨立控制理念下的產業優先路徑。
早在 2017 年,中國政府就發布了《新一代人工智慧發展規劃》,其中明確提出要加快 AI 與經濟社會的深度融合,部署構建 AI 發展的先發優勢。2021 年,與開源相關的內容被明確納入中國的「十四五規劃」,這引發了地方政府對技術創新的積極推動。
中國科學院院士梅宏曾表示,語言模型的未來發展必須依賴開源平台。只有在開放的環境中,才能確保各行業用戶的數據上傳和業務整合的安全性和可信度。
工業和資訊化部等四部門去年 12 月發布的《中小企業數位賦能專項行動計劃 (2025-2027 年)》明確支持開放原子開源基金會設立「中小企業 AI 開源專案」,提供可複製、易於推廣的培訓框架、測試工具和其他資源,以降低企業的技術門檻。
一個更現實的問題是,由於美國潛在的技術封鎖,中國不能簡單地成為 AI 領域的追隨者,而必須建立一個獨立的國內生態系統。在美國已經建立的以封閉源碼為主的生態系統下,再建立另一個封閉源碼生態系統,無異於閉門造車。只有開源生態系統才能迅速幫助 AI 產業的發展。
除了頂層支持外,各地方政府也對開源生態系統進行了真金白銀的投資。
智譜和北京國有資產共同成立的 Z 基金,專注於大型模型生態系統投資,宣布將投資 3 億元人民幣,以支持全球 AI 開源社群的發展。任何基於開源模型(不限於智譜開源模型)的創業項目都可以申請。
中國和美國在 AI 產業的開源和封閉源碼戰略上的分歧,本質上是發展邏輯的根本差異。美國由資本驅動,科技巨頭和創投的逐利需求催生了一種「技術壟斷-高價實現」的封閉源碼生態系統。即使 Meta 試圖開源,也很難逃脫商業壁壘的束縛。中國依賴頂層設計,以「技術股權 + 產業協作」為核心理念,通過政策賦權建立開放生態系統,使開源成為降低技術門檻和促進實體經濟融合的基礎設施。這種戰略選擇不僅塑造了兩國 AI 產業的不同路徑,也預示著全球 AI 生態系統加速從「壟斷競爭」走向「開放共贏」。
夠用就好
中國的 AI 開源生態系統不僅加速了中國和全球的 AI 產業化發展,也將美國對技術至上的信念置於尷尬的陷阱中。
面對 DeepSeek 效應帶來的日益增加的壓力,Meta 於 4 月 5 日發布了 Llama4,聲稱它是歷史上最強大的多模態大型模型。
然而,經過實際測試,這是一個令人失望的模型。10m tokens 的上下文長度經常出錯,初始球測試難以完成,並且發生了 9.11 > 9.9 比較大小錯誤。在模型發布後幾天內,執行長辭職和測試作弊等醜聞也被內部員工證實。
更多消息證明,Llama4 可以說是祖克柏趕著上架的產品。那麼問題是,為什麼祖克柏必須在四月份推出它?
如前所述,美國 AI 產業對技術有一種令人困惑的信念,認為他們的產品必須是最強大、最先進的,因此他們開始了一場軍備競賽。然而,訓練 AI 的邊際效應遞減導致大型製造商消耗了巨額成本,不僅沒有建立技術門檻,反而陷入了算力瓶頸的泥潭。
在 OpenAI 發布 GPT-4o 的圖像生成功能後,奧特曼幾天後發推文說他們的 GPU「燒毀」了。在 Gemini2.5 發布不到一周後,GoogleAIStudio 的負責人表示,他們仍然受到「速率限制」的困擾,開發人員每分鐘只能發送 20 個請求。似乎沒有一家公司能夠應對超大型模型的推理需求。
事實上,美國正在陷入一個誤解。智源研究院負責人表示:「如果一個新模型使用 100 倍的成本來跑出 10 分的基準分數提升,那麼這個新模型對於超過 80% 的應用場景來說是沒有意義的,因為沒有成本效益。」
中國大型模型公司正在加速開源生態系統。他們似乎不再爭奪榜首,而是以「夠用就好」的方式贏得了更多的客戶,尤其是產業客戶。
與政府和企業客戶數千萬的預算相比,許多公司和機構都有迫切的 AI 需求,但沒有那麼多現有的解決方案。使用開源模型開發自己的解決方案幾乎已成為他們唯一的選擇:
- 寶鋼使用「大型模型 + 小型模型」用於關鍵的冶金工程流程,以對生產設備進行智慧早期預警。
- 中國煤炭科學與工業集團的「煤炭科學守護者大型模型 ChinamjGPT」分別降低了設備停機時間和維護成本 30% 和 20%。
- 上海盟波智慧物聯網科技基於輕量級大型模型創建了一個邊緣切割檢測和連續退火爐工藝優化應用平台。
- 米菲科技基於大型模型技術實現了半導體晶圓廠中自動物料搬運系統的智慧預測、維護和管理。
這些都是開源模型在產業場景中實施的代表性案例。
除了產業用途外,開源生態系統還可以幫助更多的公益事業。
山水自然保護中心致力於雪豹和高原生態系統的保護。它設置的紅外線攝影機每季都會拍攝大量照片或影片。依靠人工識別雪豹痕跡非常低效且耗時。華為昇騰 (Ascend) 正在與山水自然保護中心合作以識別雪豹痕跡。華為已開源三江源紅外圖像物種識別的相關模型和工具,降低了參與 AI 開發的門檻,並允許更多使用該模型的研究和保護機構受益。人們可以共同努力,在數據集、數據處理和數據清理方面優化模型。
開源的「集市」效應
開源軟體運動的旗手 Eric Raymond 在他 1999 年的書《大教堂與集市》中提出了一個比喻:傳統的封閉源碼軟體開發模型就像建造一座大教堂。軟體由少數專家(架構師)在孤立的環境中精心設計和建造,並且僅在最終完成後才發布給用戶;開源開發模型就像一個熙熙攘攘、看似混亂但充滿活力的集市。軟體開發是開放、去中心化和進化的。
該書認為,對於許多類型的軟體專案,尤其是複雜的系統級軟體(例如操作系統核心),開放、協作和去中心化的「集市」開發模型,儘管它可能看起來混亂,但實際上比傳統的、封閉的和集中的「大教堂」模型更有效率,產生更高品質和更穩定的軟體。它可以更快地發現和修復錯誤,並通過「儘早發布,經常發布」以及利用大規模同行評審(「足夠的眼球」)等機制更好地吸收用戶反饋和社群貢獻,從而促進軟體的快速迭代和創新。
Linux 等開源專案的巨大成功驗證了 Raymond 的觀點。
開源運動為美國和世界帶來了遠遠超過其自身投資的巨大價值。哈佛大學 2024 年的一份研究報告稱:「開源投資了 41.5 億美元,並為公司創造了 8.8 兆美元的價值(也就是說,每投資 1 美元,就會創造 2,000 美元的價值)。如果沒有開源,公司在軟體上的支出將是現在的 3.5 倍。」
今天,中國公司已經學到了這一點。美國 AI 公司似乎已經忘記了它。
事實上,對於中國大型模型公司來說,即使他們不考慮社會效益,選擇擁抱開源生態系統對於公司本身來說也不是無利可圖的。
許多大型模型公司告訴 Observer.com,開源並不意味著放棄商業化。開源仍然具有開源的利潤邏輯。與是否開源相比,如何在技術上更好地服務客戶是關鍵問題。
以智譜 AI 為例,它聲稱是中國唯一一家完全對標 OpenAI 的公司,但與 OpenAI 的封閉源碼策略相比,它是業界最堅定的開源策略實踐者之一。
智譜在 2023 年率先開源了中國第一個 Chat 大型模型 ChatGLM-6B。自成立近六年以來,智譜已開源了 55 多個模型,在國際開源社群中的累計下載量接近 4000 萬次。
智譜告訴 Observer.com,智譜希望其開源策略能夠為將北京建設成為人工智慧的「全球開源之都」做出貢獻。
具體而言,在商業層面,智譜選擇通過開源吸引開發人員生態系統,並向 B 端和 G 端客戶提供付費的定制解決方案。
除了銷售解決方案外,銷售 API 也是一個重要的利潤環節。
以 DeepSeek 為例,開源模型的第一個業務是銷售高性能 API。雖然基本服務是免費的,但公司可以提供高性能 API 服務並根據使用情況收費。DeepSeek-R1 的 API 定價為每百萬個輸入 tokens 1 元人民幣,每百萬個輸出 tokens 16 元人民幣。如果免費的 token 配額用完或基本 API 無法滿足需求,用戶傾向於使用付費版本以維持業務流程的穩定性。
與僅提供模型服務的公司相比,阿里巴巴選擇了另一種開源貨幣化模型:生態系統捆綁。
阿里巴巴的 Qwen 系列作為開源先驅,通過全模態開源吸引開發人員使用雲計算和其他基礎設施,形成閉環場景。他們的模型只是早期的介紹,而標價的商品實際上是雲服務。
中國開源大型模型的全球化應用已從「技術跟隨」轉變為「生態系統主導」。當美國陷入「封閉源碼壟斷」和「開源失控」的困境時,中國正在通過「協議創新 + 場景培育」重建全球 AI 開源生態系統的底層邏輯。這場遊戲的最終戰場不在於參數規模的競爭,而在於 AI 技術與實體經濟深度融合的萬億美元市場。