科技領域已成為一個重要的戰場,尤其是在美國和中國之間。儘管西方國家實施了嚴厲的制裁,旨在扼殺中國的科技發展,但中國企業不僅沒有倒下,反而蓬勃發展。百度 (Baidu) 的文心一言 (ERNIE Bot) 就是這種韌性的最佳例證,它作為一個 AI 模型,象徵著中國對美國遏制其科技崛起努力的反抗。
西方國家的制裁,特別是拜登政府發起的那些制裁,旨在通過限制中國獲得先進半導體的途徑來阻礙中國的 AI 產業。然而,這些限制措施反而刺激了中國國內 AI 生態系統的發展,促進了一個日益獨立於西方影響的基礎設施。
自主晶片開發
起初,華為 (Huawei) 通過推出其 Ascend 晶片,讓全球分析師感到驚訝。這些晶片在 AI 應用中的硬體性能已接近 NVIDIA。在深圳進行的獨立測試顯示,在訓練大型語言模型時,Ascend 910B 晶片達到了 NVIDIA H100 約 80% 的性能——鑑於技術限制,這在幾年前被認為是無法實現的壯舉。
百度已投入超過 150 億元人民幣(約 21 億美元)用於開發其昆侖 (Kunlun) 加速器。昆侖 II 是第二代晶片,擁有 512 個核心和 770 億個電晶體,提供 256 TOPS(每秒萬億次運算),同時比其前代產品消耗更少的電力。昆侖 II 專為大型語言模型所需的基於向量的數學運算而設計,使百度能夠獨立訓練其語言模型,減少對美國供應商的依賴。
阿里巴巴 (Alibaba) 的半導體部門平頭哥 (Pingtouge) 在短短兩年內將其工程團隊從 200 人擴展到 2,000 多人。該公司最近慶祝了其開創性的 5 奈米晶片測試成功,標誌著在縮小技術差距方面邁出了重要的一步。
規避制裁的策略
中國實體採用多種策略來規避制裁,包括在阿拉伯聯合大公國、新加坡和馬來西亞運營的複雜的空殼公司網絡。這些實體採購先進的 NVIDIA A100 和 H100 晶片,並將其轉運到中國的研究中心。美國商務部在 2023 年估計,超過 10,000 個高端 AI 晶片通過這些秘密管道進入中國。
空殼公司
已確認超過 300 家公司充當購買美國晶片的中介。這些公司經常更改其名稱和所有權結構以逃避偵查。一家註冊為醫療設備進口商的杜拜公司,購買了價值超過 2 億美元的 NVIDIA 晶片,並將其分發給中國的 AI 新創公司。有趣的是,Mountain Summit Technologies 是在美國實施制裁後不久成立的。
晶片修改
另一種策略涉及修改晶片以正式規避制裁。NVIDIA 開發了特殊版本的晶片,即 A800 和 H800,以符合美國的法規,但性能有所降低。然而,中國工程師已經設計出部分恢復其計算能力的方法,將其變成了一場典型的貓捉老鼠遊戲。隨著製造商降低晶片性能,工程師們會優化軟體來抵消這些限制。
二手市場
二手市場已成為先進組件的一個意想不到的來源。中國公司積極購買具有高性能處理器和顯卡的二手伺服器和工作站,尤其是較舊的 NVIDIA 顯卡,如 V100 系列,它們在不受制裁的情況下提供強大的計算能力。2023 年,大型美國公司在不知情的情況下將退役的數據中心出售給中介機構,然後這些中介機構將顯卡轉售給中國公司。
創新的計算架構
中國對制裁最雄心勃勃的回應是開發針對 AI 進行優化但基於與西方主流解決方案不同原則的新計算架構。上海一家 AI 實驗室與復旦大學合作,正在開發一種模仿人腦結構的 neuromorphic 處理器。這種 neuromorphic 計算平台 (NCP) 使用人工神經元和突觸的網絡,與傳統圖形處理器相比,可提供更高的能源效率。
文心一言:中國 AI 成功的象徵
百度 (Baidu) 的文心一言 (ERNIE) (Enhanced Representation through Knowledge Integration) 體現了中國 AI 戰略的有效性。其最新版本文心一言 4.0 (ERNIE 4.0) 在西方引起了關注。中國清華大學進行的獨立測試表明,在需要了解中國文化背景的任務中,文心一言 4.0 超越了 GPT-4,而在其他領域則取得了相當的成果。
文心一言 4.0 建立在 Transformer 架構之上,融合了重要的創新。其中一項創新是「具有增強深度的知識 Transformer」,它將來自中國來源(如百度百科)的百科全書知識整合到模型的訓練過程中。另一個值得注意的特性是文心一言 4.0 的「持續學習」能力,使其能夠使用新數據進行訓練,而不會丟失先前獲得的知識,這是對西方模型的重大進步。
文心一言 (ERNIE Bot) 在中國市場上享有根本的優勢,因為它的開發是根據中國用戶量身定制的,考慮了當地的語言和文化細微差別。這在與中國成語和文化典故相關的測試中尤為明顯,文心一言 4.0 的準確率達到 95%,而 GPT-4 的準確率為 45%。
審查制度作為催化劑
具有諷刺意味的是,中國的審查要求可能促進了文心一言的開發。雖然像 GPT-4 這樣的西方模型在接受訓練時具有嚴格的安全措施和過濾器,限制了它們的能力,但文心一言雖然受到審查,但在不同的標準下接受訓練,在某些領域允許更大的靈活性。中國模型對允許和禁止的內容有不同的定義,創造了一種有趣的非對稱性,即文心一言可以討論 GPT-4 認為禁忌的話題,同時避免在中國境內出現政治敏感問題。
百度全面的生態系統
百度已經圍繞文心一言建立了一個全面的生態系統,西方競爭對手難以複製。文心一言 (ERNIE Bot) 擁有以下關鍵優勢,包括:
- 訪問龐大的中文數據集: 百度 (Baidu) 的搜索引擎提供了獨特的中文文本、查詢和互動集合,時間跨度超過 20 年。
- 與百度 (Baidu) 的應用生態系統深度整合: 文心一言 (ERNIE Bot) 與超過 50 個百度 (Baidu) 應用程式整合,創建了一個數據和互動的閉環。
- 更好地理解中國文化背景: 該模型基於中國文學、歷史和當地媒體進行訓練。
- 政府支持和保護主義政策: 中國立法偏向於戰略領域的國內解決方案。
- 針對中國硬體進行優化: 文心一言 (ERNIE Bot) 針對昆侖 (Kunlun) 等中國處理器進行了優化。
百度 (Baidu) 的戰略通過在東南亞和非洲的合作夥伴關係,擴展到國內市場之外。文心一言 (ERNIE Bot) 提供馬來西亞、泰國和奈及利亞的本地語言版本。作為「數字絲綢之路」倡議的一部分,百度 (Baidu) 為發展中國家的政府和公司提供對其 AI 技術的特殊訪問條件。在肯亞和衣索比亞,百度 (Baidu) 與當地電信運營商合作,通過簡訊介面提供對文心一言 (ERNIE Bot) 的訪問。
百度 (Baidu) 的首席技術官王海峰解釋說,他們的解決方案考慮了新興市場的具體情況,提供需要較低頻寬並且可以在低端硬體上運行的模型。在印尼,文心一言 (ERNIE Bot) 因與本地應用程式整合,在三個月內獲得了超過 800 萬活躍用戶。
對 AI 的投資
根據 IDC 的數據,中國對 AI 的投資在過去一年中增長了 58%,達到超過 1200 億美元,而美國的增長率為 35%。2023 年 6 月,中國科技部宣布設立一項價值 8000 億元人民幣(約 1110 億美元)的專項基金,專門用於國內 AI 技術。各區域和市政府也在建立自己的支持計劃,例如上海承諾到 2025 年投資 1000 億元人民幣(140 億美元)於其本地 AI 生態系統。
私人投資也很可觀,2023 年中國 AI 新創公司籌集了 450 億美元的資金,增長了 75%。投資者對量子計算、AI 晶片和多模態模型特別感興趣。紅杉中國 (Sequoia China),現在的紅杉 (HongShan),已承諾獨家投資 80 億美元於中國 AI 新創公司。
制裁的影響
專家指出,制裁出乎意料地加速了中國AI 生態系統的發展,迫使企業自給自足,並更密集地投資於研究。雖然技術差距依然存在,但正在迅速縮小。在制裁之前,中國公司依賴西方技術,但美國的限制造成了一種生存威脅,動員了資源和人才。
中國政府啟動了「本地創新」計劃,為投資國內 AI 技術的公司提供稅收優惠和優惠貸款,吸引了超過 5,000 家致力於本地化其供應鏈的公司。
此外,還有中國 AI 專家從國外回流的趨勢。2023 年,超過 3,000 名專門研究 AI 的中國研究人員和工程師返回中國,是 2020 年數字的兩倍多。
制裁也影響了美國公司。NVIDIA 失去了進入中國市場的途徑,該市場每年價值超過 100 億美元,並加大了遊說力度以放寬限制。英特爾 (Intel) 和 AMD 也報告了重大營收損失,美國半導體公司因制裁集體損失超過 250 億美元,導致研發預算減少。
AI 的未來
當世界關注 OpenAI、Anthropic 和 Google 時,美國在 AI 領域的真正挑戰可能來自中國。文心一言 (ERNIE Bot) 和其他中國模型可能成為西方解決方案的全球替代品。
麥肯錫 (McKinsey) 預測,到 2028 年,中國 AI 模型將在全球大多數應用程式中具有競爭力,並在圖像識別和亞洲語言處理等領域佔據主導地位。來自戰略與國際研究中心的 Sarah Miller 博士警告說,可能會分為兩個影響力範圍:一個由 GPT 和 Claude 主導的西方範圍,以及一個由文心一言 (ERNIE Bot) 主導的東方範圍。這種情況可能會影響技術、地緣政治、貿易和全球倫理標準。
百度 (Baidu) 的 CEO 李彥宏認為,外部限制可能會減緩發展,但無法阻止創新。他將文心一言 (ERNIE Bot) 視為中國 AI 生態系統能夠抵禦制裁,並將其轉化為發展催化劑的證明。
儘管存在政治不穩定,但美國和中國之間的科技冷戰正在進入一個決定性的階段。