中國AI新創以低預算挑戰美國AI霸權
美國投入巨額資金以鞏固其在人工智慧領域的領導地位,然而,一家預算看似「玩笑」般的中國新創公司,可能已經動搖了這份希望。總部位於杭州的Deepseek(DeepSeek)發布了多款開源人工智慧模型,這些模型在效能上可與OpenAI相提並論,同時更具效率且成本更低。
人工智慧領域正上演一場「大衛對歌利亞」的較量。一方是美國及其新的「星際之門」計畫,該計畫承諾投入5000億美元,並得到科技巨頭的支持,以在美國各地建立數據中心。另一方則是一家敢於挑戰的中國新創公司,該公司以極低的預算訓練出了令人印象深刻的開源模型。
本週稍早,Deepseek發布了其R1模型,這家新創公司聲稱,該模型在效能上達到甚至超越了OpenAI去年發布的o1模型(o1模型旨在解決推理和數學問題)。Deepseek已將其模型公開發布,評論員對其處理編碼和推理等任務的能力印象深刻。
R1的發布緊隨這家中國新創公司12月份的一項聲明,即其大型語言模型V3僅使用了價值560萬美元的計算能力進行訓練,遠低於據報導用於訓練GPT-4的1億美元以上。Deepseek表示,其V3模型在主要基準測試中與OpenAI和Anthropic的模型效能相當。
曾在特斯拉和OpenAI從事人工智慧工作的Andrej Karpathy讚揚了Deepseek以「玩笑般的預算」訓練其前沿人工智慧的能力。
這些聲明使Deepseek脫穎而出,成為中國競爭激烈的人工智慧領域的領頭羊。Deepseek40歲的創辦人梁文鋒週一會見了中國國務院總理李強,與一群行業領軍人物一同出席了會議。《南華早報》報導了這一消息。
Deepseek的成功表明,儘管被禁止使用訓練人工智慧模型的黃金標準NVIDIA晶片,中國科技行業正在全球人工智慧競賽中找到自己的定位。
Deepseek的崛起之路
Deepseek總部位於杭州,脫胎於中國量化對沖基金高鵠資本。據《南華早報》報導,截至2019年,高鵠資本管理著100億元人民幣(合今天的14億美元)的資產。該基金於2023年分拆出Deepseek,將其定位為一家人工智慧新創公司,專注於開發模型和構建人工智慧產品。
Deepseek創辦人梁文鋒在浙江大學學習人工智慧,之後共同創立了高鵠資本。高鵠資本雄厚的資金實力使其能夠在2022年美國實施限制之前搶購數千枚NVIDIA人工智慧晶片。這使得Deepseek比許多規模較小的競爭對手更具優勢,使其能夠繼續開發和訓練模型,而其他人工智慧新創公司則在爭奪處理能力。
人工智慧專家對Deepseek與OpenAI的ChatGPT和Anthropic的Claude的效能差異持不同看法,認為中國人工智慧模型在特定硬體配置下符合基準,但在其他情況下則表現不佳。但Deepseek專注於以更高效、更低成本的方式實現OpenAI和Anthropic所取得的成就。這家新創公司的模型使用了許多智慧軟體創新技術,以繞過其「專家混合」模型的限制,在該模型中,人工智慧的不同部分被訓練來處理特定類型的問題。
另一個不同之處在於,Deepseek的模型是開源的,可以在不同類型的硬體上使用。更重要的是,該模型會展示其如何得出答案,這與OpenAI的o1不同。
這對於那些因美國開發的高昂模型而望而卻步的客戶來說可能已經足夠了,特別是那些在世界其他地區,現在受到限制而無法獲得大量美國計算資源的客戶。
美國為何擔憂中國人工智慧?
如果美國官員如願以償,一家中國公司將不可能生產出領先的人工智慧模型。自2022年以來,美國一直控制著向中國銷售先進人工智慧晶片,阻止中國公司獲得訓練前沿人工智慧模型所需的處理器。NVIDIA和Intel等晶片製造商曾試圖為中國市場生產符合美國要求的處理器,但華盛頓進一步收緊了規則。
這使得中國人工智慧公司幾乎沒有選擇:
- 依賴禁令生效前進口的美國製造晶片
- 利用從第三方地點運送晶片的灰色市場走私團伙
- 依賴中國境外的數據中心
- 或者轉向華為等公司的中國製造替代品。(華為聲稱其人工智慧晶片的效能優於NVIDIA的A100處理器,但據報導,這家中國科技巨頭在可靠地大規模生產晶片方面遇到了困難)。
梁文鋒去年告訴中國媒體36氪(由ChinaTalk通訊在11月翻譯):「對我們來說,錢從來都不是問題;對先進晶片運輸的禁令才是問題。」
除了晶片出口禁令外,拜登政府還禁止美國對中國人工智慧進行投資。
儘管如此,中國已經培育了一個充滿活力和多樣化的人工智慧領域。百度、阿里巴巴和字節跳動等大型科技公司正在開發自己的基礎模型,並向企業和普通用戶提供新的人工智慧服務。像MiniMax和Moonshot AI這樣的中國人工智慧新創公司已經發布了以消費者為中心的服務,甚至在美國市場取得了成功。
然而,中國的人工智慧領域非常擁擠,這意味著各公司都在進行價格戰以排擠競爭對手。在2024年全年,阿里巴巴和字節跳動等公司將價格大幅削減了高達90%,以推廣其模型並超越競爭對手。
中國在人工智慧領域的成功令美國感到不安,這意味著為保護美國在人工智慧領域的領導地位而採取的廣泛措施並未奏效。「我以為我們對晶片的限制會讓他們落後,」Google前執行長Eric Schmidt去年11月在哈佛大學甘迺迪學院的一次演講中表示。
ChatGPT的開發者已經對中國發出了警報。上週,OpenAI在一份政策文件中聲稱,「估計有1750億美元的全球資金等待投資於人工智慧項目。」
OpenAI表示:「如果美國沒有吸引到這些資金,它們將流向中國支持的項目,從而加強中國共產黨在全球的影響力。」OpenAI希望它很快就能獲得其中的一些資金。週二,OpenAI執行長Sam Altman、軟銀執行長孫正義和甲骨文聯合創辦人Larry Ellison宣布了「星際之門計畫」,該計畫承諾在美國各地投資5000億美元用於人工智慧基礎設施。