美國與中國之間的科技競爭日趨激烈,中國企業在克服西方制裁障礙方面取得了越來越大的成功。百度及其旗艦模型文心一言(ERNIE Bot)的出現,象徵著中國在科技上對抗美國壓制所展現的韌性。
原本旨在遏制中國人工智慧發展的制裁,諷刺地促進了其國內AI生態系統的發展,為獨立於西方的科技基礎設施奠定了基礎。
拜登政府延續川普總統發起的政策,透過切斷先進半導體的供應,旨在阻止中國的人工智慧發展。然而,結果卻截然不同。中國科技公司不僅倖存下來,還加速了本土AI解決方案的開發。
挑戰預期:中國國產晶片組
起初,華為推出昇騰(Ascend)晶片,其AI應用性能可媲美NVIDIA晶片,令全球分析師感到驚訝。一間深圳獨立實驗室進行的內部測試顯示,昇騰910B晶片在訓練大型語言模型方面的任務中,達到了NVIDIA H100晶片80%的性能。對於一家與西方技術隔絕的公司來說,這項成就似乎在兩年前還是不可能的。
百度方面,已投資超過150億元人民幣(約21億美元)開發崑崙(Kunlun)加速器,專為處理大型語言模型而設計。第二代崑崙晶片崑崙II,擁有512個核心,770億個電晶體,並提供256 TOPS(每秒兆次運算)的性能,同時功耗僅為其前代產品的一半。
崑崙II處理器專為向量數學運算而設計,這對於大型語言模型至關重要。這使中國公司能夠訓練其語言模型,而無需依賴進口晶片,確保了對美國供應商的獨立性。
阿里巴巴透過其平頭哥(Pingtouge)部門,在過去兩年中將其半導體設計工程師團隊從200人擴展到2,000多人。該公司最近宣布成功測試了其首款5奈米晶片,這是彌合技術差距的重要一步。
繞過障礙:中國的策略
中國公司採取多種創新策略來繞過制裁,展現出卓越的有效性和全面性。
透過第三國的空殼公司網絡
美國情報部門的調查發現,主要在阿拉伯聯合大公國、新加坡和馬來西亞運營的空殼公司網絡錯綜複雜。這些實體採購先進的NVIDIA A100和H100晶片,然後運往中國的研究中心。僅在2023年,美國商務部估計就有超過10,000顆先進AI晶片透過此後門進入中國。
一個由300多家公司組成的網絡被確認,這些公司沒有從事任何實際的運營活動,而是充當購買美國晶片的中介。這些公司經常更換名稱和所有權結構,以避免被發現。
在杜拜發現了一個特別引人入勝的案例,一家註冊為醫療設備進口商的公司購買了價值超過2億美元的NVIDIA晶片,然後分發給中國的AI新創公司。涉案公司Mountain Summit Technologies在美國實施制裁後僅一個月就成立了。
重新設計和「降級」技術
另一種策略是故意重新設計晶片,使其在技術上不屬於制裁範圍。NVIDIA為了保持其重要的中國市場地位,創建了特殊版本的晶片——A800和H800——經過修改以符合美國法規。儘管與A100和H100版本相比,官方性能有所降低,但中國工程師已經找到部分恢復其原始計算能力的方法。
這是一場典型的貓捉老鼠的遊戲。隨著製造商降低晶片性能以滿足監管要求,中國公司已經找到優化軟體的方法來彌補這些限制,從而在規避制裁的同時,能夠獲得最新的技術發展。
在二級市場上收購二手晶片
二手零件市場已成為先進組件的一個令人驚訝的來源。中國公司積極購買具有先進處理器和顯示卡的二手伺服器和工作站。舊款的NVIDIA顯示卡,例如V100系列,特別有價值。它們不受制裁的約束,但仍然為AI任務提供強大的計算能力。
2023年,人們發現幾家大型美國公司在不知情的情況下,將其退役的數據中心出售給中介機構,然後這些中介機構將顯示卡轉售給中國公司。雖然新法規已部分解決了此漏洞,但專家預測,二手零件市場仍將是中國公司組件的重要來源。
開發替代計算架構
對制裁最雄心勃勃的回應是開發全新的計算架構,該架構針對AI進行了優化,但在與主流西方解決方案不同的原理上運行。上海人工智慧實驗室與復旦大學合作,正在開發一種模仿人腦結構的神經形態處理器。
這種新的神經形態計算平台(NCP)使用與傳統GPU完全不同的架構。它不採用大規模平行處理,而是採用人工神經元和突觸的網絡,從而在能效方面具有顯著優勢。
文心一言:中國巨頭崛起
百度推出的文心一言(ERNIE Bot)(Enhanced Representation through Knowledge Integration),是中國策略有效性的最佳例證。該模型於2023年3月首次亮相,但其最新版本——文心一言4.0——引起了西方的擔憂。中國清華大學進行的獨立測試表明,文心一言4.0在需要中文文化知識的任務中表現優於GPT-4,而在其他類別中的表現與OpenAI模型相當。
令人驚訝的架構
文心一言4.0基於Transformer架構,與OpenAI和Google模型類似,但包含多項重大創新。其中之一是「知識增強深度Transformer(Knowledge Transformer with Enhanced Deepening)」,它將來自中國來源(例如百度百科(相當於中文版的Wikipedia))的百科知識直接整合到模型的訓練過程中。
另一個獨特的方面是「持續學習」的能力。文心一言4.0可以使用新數據持續訓練,而不會有「忘記」先前獲得的知識的風險,與需要完全重新訓練才能進行更新的西方模型相比,這是一項重大進步。
中國語境作為競爭優勢
儘管受到制裁,中國的AI模型仍在以驚人的速度發展。文心一言在中國市場具有根本優勢。它的開發考慮了中國用戶的需求,考慮了西方模型所缺乏的當地語言和文化細微差別。
這種優勢在與中國成語、諺語和文化典故相關的測試中尤為明顯。文心一言4.0在理解和生成傳統的四字中文成語(chengyu)方面達到了95%的準確率,而GPT-4在同一任務中僅達到45%。
審查制度成為訓練中意想不到的資產
矛盾的是,中國的審查要求可能促進了文心一言的發展。像GPT-4這樣的模型使用各種安全措施和過濾器進行訓練,這些措施通常會限制它們的功能。文心一言雖然受到審查,但在不同的標準下進行訓練。
百度聯合創始人、董事長兼執行長李彥宏在2023年10月舉行的百度世界2023大會上宣布了文心一言4.0。
中國模型對允許和禁止的內容有不同的定義。這創造了一種有趣的非對稱性。文心一言可以自由地討論GPT-4視為禁忌的話題,但避免在中國討論政治敏感話題。
文心一言相對於西方競爭對手的關鍵優勢
百度圍繞其旗艦AI模型創建了一個全面的生態系統,西方競爭對手會發現很難複製。文心一言相對於西方競爭對手具有關鍵優勢,即:
- 存取海量的中文數據集: 作為中國最受歡迎的搜尋引擎的運營商,百度擁有獨特的中文文本、查詢和互動集合,涵蓋了中國互聯網歷史的20多年。
- 與百度應用生態系統的深度整合: 文心一言與50多個百度應用程式整合,從地圖到串流媒體服務,創建了一個西方競爭對手無法獲得的數據和互動的閉環。
- 更好地理解中國文化背景: 該模型接受了中國文學、歷史和當地媒體的訓練,使其能夠深入了解文化細微差別和歷史參考。
- 政府支持和保護主義政策: 中國法律偏愛國內解決方案,尤其是在被視為戰略性的行業中,這使得文心一言在擁有超過14億潛在用戶的市場中佔據優勢。
- 針對中國硬體進行優化: 與西方模型不同,文心一言經過優化,可以在中國處理器(例如崑崙)上運行,從而確保以更低的能耗獲得更好的性能。
從本地玩家到全球擴張
百度的策略不僅限於國內市場。該公司已與全球南方(Global South)的公司建立了合作夥伴關係,特別是在東南亞和非洲。在馬來西亞、泰國和奈及利亞,文心一言已經提供本地語言版本,而OpenAI和Anthropic模型仍在計劃將其業務擴展到這些市場。
「數位絲綢之路」倡議
作為「數位絲綢之路」倡議的一部分,該倡議是更廣泛的「一帶一路」項目的一部分,百度向來自開發中國家的政府和公司提供其AI技術的特殊存取條件。在肯亞和衣索比亞,百度正在與當地電信運營商合作,透過簡單的簡訊介面提供對文心一言的存取,即使對於沒有智慧型手機或高速互聯網存取權限的人也能夠使用AI。
滿足當地需求
「與主要為已開發國家用戶設計的西方模型不同,我們的解決方案考慮了開發中市場的特殊性,」百度首席技術官王海峰解釋說。「我們提供需要更少頻寬並在低端硬體上運行的模型,這是市場(例如非洲和東南亞)廣泛採用的關鍵。」
該策略產生了實際成果。在印尼,百度與當地科技巨頭GoTo合作,文心一言在推出後僅三個月就獲得了超過800萬的活躍用戶,這主要歸功於它與流行的本地應用程式的整合。
投資競賽:數兆元人民幣投入人工智慧
根據國際數據公司(IDC)的數據,中國在過去一年中對人工智慧的投資增長了58%,達到超過1200億美元。相比之下,美國的增長率為35%。
前所未有的國家支持
中國科學技術部於2023年6月宣布設立一項價值8000億元人民幣(約1110億美元)的專項基金,專門用於開發國內AI技術。此外,省級和市級政府正在制定其支持計劃。例如,上海已承諾到2025年向其本地AI生態系統投資1000億元人民幣(140億美元)。
「這是對資源前所未有的動員,」彼得森國際經濟研究所的Mary Johnson博士評論說。「中國將人工智慧視為國家安全和國際競爭力的關鍵要素,導致投資水平堪比1960年代的美國太空計劃。」
私人資本追隨國家資本
私人投資追隨國家投資。根據PitchBook的數據,2023年中國AI新創公司共籌集了450億美元的資金,比上一年增長了75%。投資者對專門從事量子計算、AI晶片和多模態模型的公司特別感興趣。
紅杉中國(Sequoia China)在與其美國母公司分離後更名為紅杉(HongShan),已承諾專門向中國AI新創公司投資80億美元。
「我們相信,未來5年內,中國至少會出現50家價值超過10億美元的AI『獨角獸』公司,」紅杉創始人沈南鵬預測。
回力鏢效應:制裁加速中國發展
專家指出,制裁可能反而加速了中國AI生態系統的發展,迫使公司變得更加自給自足,並加大對研究的投資。儘管美國和中國之間仍然存在技術差距,但差距正在以驚人的速度縮小,這讓人們質疑美國遏制策略的有效性。
加速供應鏈的本土化
在制裁之前,中國公司依賴西方技術,並且沒有多少動力來開發自己的解決方案。美國的限制造成了生存威脅,以通常需要數十年時間才能實現的方式調動了資源和人才。
為了應對制裁,中國政府啟動了「本地創新」計劃,該計劃為投資於國內AI技術開發的公司提供巨額稅收優惠和優惠貸款。該計劃已吸引了5,000多家公司,這些公司已承諾將其供應鏈本地化。
人才回流
一個有趣的現象是中國AI專家從國外返回。根據中國教育部的数据,2023年有超过3,000名先前在美国和欧洲工作的中国AI科学家和工程师返回中国,是2020年的两倍多。
「在矽谷,我對自己作為一名中國研究人員的地位越來越感到不確定,」陳曉輝博士解釋說,他在Google工作了15年後返回北京加入百度的AI團隊。「在中國,我可以存取海量的數據集、重要的計算資源,最重要的是,有機會參與對國家具有戰略意義的項目。」
對美國商業的意外後果
制裁也影響了美國公司。NVIDIA的GPU對於AI開發至關重要,但已失去了進入中國市場的機會,該市場每年價值超過100億美元。作為回應,該公司加大了遊說力度以放寬限制,聲稱制裁對美國競爭力的損害大於對中國的損害。
Intel和AMD也報告了收入大幅下降。高盛估計,由於制裁,美國晶片製造商總共損失了超過250億美元的潛在收入,導致研發預算減少,並可能減緩技術進步。
未來由中國色彩描繪
當世界關注OpenAI、Anthropic和Google之間的競爭時,美國在AI領域的主導地位的真正威脅可能來自不同的方向。文心一言和其他中國模型可能很快成為西方解決方案的全球替代品,重塑未來幾十年的世界科技版圖。
未來預測
麥肯錫諮詢公司的分析師預測,到2028年,中國AI模型將在全球大多數應用中具有競爭力,並且在某些領域(例如圖像識別和亞洲語言處理)中,它們甚至可能實現主導地位。
「在未來的五年內,我們確實面臨著一個數位世界分裂為兩個勢力範圍的真正風險,」戰略與國際研究中心的Sarah Miller博士警告說。「一個是西方世界,由GPT和Claude等模型主導,另一個是東方世界,由文心一言和類似的解決方案主導。」
這種情況不僅可能對技術產生深遠的影響,還可能對地緣政治、貿易和關於人工智慧的全球道德標準產生深遠的影響。
創新的最後發言權
百度執行長李彥宏以其一貫樂觀的措辭總結了這種情況:「外部限制可能會減緩發展,但它們無法阻止創新。技術的歷史表明,真正的進步總能找到出路。文心一言證明,中國AI生態系統不僅能夠抵禦制裁,還可以將其轉化為其發展的催化劑。」
儘管存在政治不穩定,但有一點是肯定的:美國和中國之間的技術冷戰正在進入決定性階段,其結果可能與美國領導人最初預期的截然不同。