螞蟻集團的 AI 模型訓練創新方法
由馬雲支持的金融科技巨頭螞蟻集團,在人工智能領域取得了一項重大突破,成功利用中國製造的半導體。這種創新方法使該公司能夠開發出訓練 AI 模型的新技術,並顯著降低了 20% 的成本。熟悉此事的消息人士透露,螞蟻集團利用國產晶片,包括其關聯公司阿里巴巴集團控股有限公司和華為技術有限公司的晶片,採用專家混合 (Mixture of Experts, MoE) 機器學習方法來訓練模型。
螞蟻集團取得的成果可與使用 Nvidia Corp. 的晶片(例如 H800)所獲得的成果相媲美,H800 是一款功能強大的處理器,但受美國限制出口到中國。雖然螞蟻集團仍繼續使用 Nvidia 進行 AI 開發,但其最新的模型越來越依賴替代方案,包括 Advanced Micro Devices Inc. (AMD) 和中國晶片。
進入 AI 競賽:中國 vs. 美國
螞蟻集團進軍 AI 模型開發領域,使其直接置身於中國和美國公司之間的激烈競爭之中。自 DeepSeek 展示了以 OpenAI 和 Alphabet Inc. 的 Google 等行業巨頭(已投入數十億美元)的一小部分成本來訓練高性能模型的潛力以來,這場競賽愈演愈烈。螞蟻集團的成就突顯了中國公司利用本土替代品取代最先進的 Nvidia 半導體的決心。
具有成本效益的 AI 推理的前景
螞蟻集團本月發布的研究論文強調了其模型的潛力,聲稱在某些基準測試中表現優於 Meta Platforms Inc.,儘管這些說法尚未得到彭博新聞社的獨立驗證。然而,如果螞蟻集團的平台如其所宣傳的那樣運作,它們可能代表著中國人工智能發展的重大進步。這主要是因為它們能夠大幅降低推理成本,而推理是支持 AI 服務的過程。
專家混合:AI 領域的遊戲規則改變者
隨著各公司將大量資源投入 AI,MoE 模型作為一種流行且高效的方法而聲名鵲起。這種技術被 Google 和總部位於杭州的初創公司 DeepSeek 等公司採用,涉及將任務劃分為更小的數據集。這類似於擁有一支專家團隊,每個人都專注於工作的特定部分,從而優化整個流程。
克服 GPU 瓶頸
傳統上,MoE 模型的訓練嚴重依賴高性能晶片,例如 Nvidia 製造的圖形處理單元 (GPU)。這些晶片的過高成本一直是許多小型公司的主要障礙,限制了 MoE 模型的廣泛採用。然而,螞蟻集團一直在努力研究更有效地訓練大型語言模型 (LLM) 的方法,有效地消除了這一限制。他們的研究論文的標題明確反映了這一目標,該標題設定了「無需頂級 GPU」即可擴展模型的目標。
挑戰 Nvidia 的主導地位
螞蟻集團的方法直接挑戰了 Nvidia 首席執行官黃仁勳所倡導的主流策略。黃仁勳一直認為,即使出現像 DeepSeek 的 R1 這樣更高效的模型,計算需求仍將繼續增長。他認為,公司將需要更好的晶片來產生更高的收入,而不是更便宜的晶片來降低成本。因此,Nvidia 一直專注於構建具有增強處理核心、電晶體和更大記憶體容量的大型 GPU。
量化成本節省
螞蟻集團提供了具體的數字來證明其優化方法的成本效益。該公司表示,使用高性能硬體訓練 1 兆個 token 的成本約為 635 萬元人民幣(88 萬美元)。然而,通過利用較低規格的硬體和其優化技術,螞蟻集團可以將此成本降低至 510 萬元人民幣。Token 代表模型處理以了解世界並向用戶查詢提供相關回應的資訊單位。
利用 AI 突破開發工業解決方案
螞蟻集團計劃利用其在大型語言模型(特別是 Ling-Plus 和 Ling-Lite)方面的最新進展,為醫療保健和金融等行業開發工業 AI 解決方案。這些模型旨在滿足特定行業的需求並提供量身定制的解決方案。
擴大 AI 在醫療保健領域的應用
螞蟻集團對醫療保健的承諾體現在其將中國線上平台好大夫在線 (Haodf.com) 整合到其人工智能服務中。通過創建 AI 醫生助理,螞蟻集團旨在支持好大夫在線的 29 萬名醫生的廣泛網絡,協助處理醫療記錄管理等任務。這種 AI 應用有可能顯著提高醫療保健服務的效率和準確性。
AI 驅動的日常生活助手
除了醫療保健,螞蟻集團還開發了一款名為「智小寶」的 AI「生活助手」應用程式和一款名為「螞蟻小財」的金融諮詢 AI 服務。這些應用程式展示了螞蟻集團將 AI 融入日常生活各個方面的雄心,為用戶提供個性化和智能的幫助。
基準測試性能:Ling 模型 vs. 競爭對手
在其研究論文中,螞蟻集團聲稱 Ling-Lite 模型在英語理解的關鍵基準測試中優於 Meta 的 Llama 模型之一。此外,Ling-Lite 和 Ling-Plus 模型在中文基準測試中均表現出優於 DeepSeek 同類產品的性能。這突顯了螞蟻集團在 AI 領域的競爭地位。
正如總部位於北京的 AI 解決方案提供商盛世科技的首席技術官 Robin Yu 所說:「如果你找到一個點來擊敗世界上最好的功夫大師,你仍然可以說你打敗了他們,這就是為什麼實際應用很重要。」
開源促進協作與創新
螞蟻集團已將 Ling 模型開源,促進了 AI 社群內的協作和創新。Ling-Lite 包含 168 億個參數,這些參數是控制模型性能的可調整設置。另一方面,Ling-Plus 擁有更大的 2900 億個參數,使其成為更大的語言模型之一。為了提供背景信息,專家估計 ChatGPT 的 GPT-4.5 大約有 1.8 兆個參數,而 DeepSeek-R1 有 6710 億個參數。
應對模型訓練中的挑戰
螞蟻集團開發這些模型的過程並非一帆風順。該公司在訓練的某些領域遇到了困難,特別是在穩定性方面。即使硬體或模型結構發生微小變化,也可能導致問題,包括模型錯誤率的波動。這突顯了訓練高級 AI 模型所涉及的複雜性和敏感性。
醫療保健領域的實際部署
螞蟻集團對實際應用的承諾進一步體現在其部署以醫療保健為重點的大型模型機器上。這些機器目前正被北京和上海等主要城市的七家醫院和醫療保健提供商使用。該大型模型利用 DeepSeek R1、阿里巴巴的 Qwen 和螞蟻集團自己的 LLM 來提供醫療諮詢服務。
AI 代理增強醫療保健服務
除了大型模型機器,螞蟻集團還推出了兩款醫療 AI 代理:Angel 和醫保兒。Angel 已經為 1000 多家醫療機構提供服務,而醫保兒則為醫療保險服務提供支持。此外,在去年 9 月,螞蟻集團在其支付寶應用程式中推出了 AI 醫療保健管家服務,進一步擴大了其在醫療保健領域的影響力。這些舉措表明,螞蟻集團致力於利用 AI 來改變和改善醫療保健服務。