阿里巴巴集團近期發表了名為 ZEROSEARCH 的開創性框架,該公司聲稱該框架能夠大幅降低人工智慧 (AI) 模型的訓練成本近 90%。這項創新技術允許大型語言模型 (LLM) 模擬搜尋操作,而無需實際的應用程式介面 (API) 調用,從而解決與文件品質以及通常與傳統 AI 訓練方法相關的過高成本有關的關鍵問題。隨著阿里巴巴繼續在全球範圍內擴大其 AI 驅動的解決方案,這種大幅降低的成本有可能重塑 AI 開發不斷發展的競爭格局。反映出其在技術領域的強勁定位和策略進展,自年初以來,阿里巴巴的股價已大幅上漲,攀升了 48.77%。
ZEROSEARCH 的黎明:AI 訓練的典範轉移
阿里巴巴集團控股有限公司 (BABA) 推出了 ZEROSEARCH,這是一個突破性的框架,有望透過顯著降低涉及的財務障礙來徹底改變 AI 訓練。 這項技術解決了開發複雜語言模型的核心挑戰:巨大的計算和資源需求。
解決 AI 訓練的高成本
ZEROSEARCH 的核心在於它能夠模擬搜尋行為,這是許多 AI 訓練流程的基本組成部分,而不會產生與真實世界 API 調用相關的成本。 傳統的 AI 訓練通常涉及大型語言模型查詢搜尋引擎以收集資訊。 該過程充滿了挑戰:
- 高 API 成本: 每次對搜尋引擎的查詢都會產生費用,而當訓練大型模型時,這些費用可能會迅速上升到令人望而卻步的程度。
- 文件品質不一致: 從搜尋引擎檢索的資料的品質可能差異很大,可能會扭曲訓練過程並導致次優的模型效能。
ZEROSEARCH 透過建立一個模擬環境來減輕這些問題,在該環境中,LLM 可以「搜尋」資訊而無需外部 API 調用。
ZEROSEARCH 的運作方式:深入了解這項技術
ZEROSEARCH 透過一個多階段流程運作,旨在優化大型語言模型的訓練,同時最大限度地降低成本並確保資料品質。
輕量級監督微調
初始階段包括採用大型語言模型並透過稱為輕量級監督微調的過程來完善它。 這將 LLM 轉換為阿里巴巴所描述的「檢索模組」。 該模組旨在產生有用的和嘈雜的文件,模仿真實世界中搜尋結果通常包含相關和不相關資訊的混合體的情況。
基於課程的推出策略
第二個關鍵階段是強化學習 (RL) 訓練,模型在其中學習辨別和優先排序有用的資訊。 ZEROSEARCH 採用獨特的基於課程的推出策略:
- 逐步增加難度: 模型最初呈現相對容易的檢索情境,並且隨著訓練的進行,難度會逐漸增加。
- 模仿真實世界的複雜性: 這種方法允許模型以結構化的方式學習,逐漸建立其處理更複雜和模稜兩可的搜尋任務的能力,就像學生透過越來越具有挑戰性的課程作業一樣。
透過從更簡單的情境開始並逐漸增加複雜性,ZEROSEARCH 確保模型能夠有效地學習,而不會從一開始就被真實世界資料的複雜性所淹沒。
ZEROSEARCH 的策略意義
隨著阿里巴巴的雲端部門加緊努力以加強其在全球範圍內的 AI 產品,ZEROSEARCH 的推出在策略上是適時的。 這包括擴展平台即服務 (PaaS) 選項,並完善其專有的大型語言模型,例如 Qwen-Max 和 Qwen-Plus。
在 AI 領域的競爭優勢
ZEROSEARCH 所承諾的大幅降低成本有可能顯著改變 AI 開發的競爭格局。 它降低了較小參與者的進入門檻,並使較大的公司能夠更有效地分配資源。 這種轉變可以促進更大的創新,並加速跨各個領域的新 AI 應用程式的開發。
DeepSeek 先例
AI 開發的格局越來越關注成本效益。 當中國 AI 新創公司 DeepSeek 聲稱以一小部分成本超越 OpenAI 模型時,它表明了 AI 開發可能如何進行的轉變。 從那時起,阿里巴巴及其競爭對手一直在推出越來越經濟實惠的商業智慧工具,其中一些工具的價格低至個人開發者每年 1 美元。 ZEROSEARCH 是朝這個方向邁出的另一步,有可能使人們更容易獲得先進的 AI 技術。
阿里巴巴更廣泛的 AI 策略
阿里巴巴對 AI 的承諾體現在其持續的投資和策略性計畫中。
Qwen 系列
4 月,阿里巴巴推出了 Qwen 3 旗艦模型,展示了其對 AI 創新的承諾。 埃迪吳和蔡崇信領導了對 AI 的積極推動,凸顯了 AI 對阿里巴巴未來成長策略的重要性。
財務表現
阿里巴巴的股票表現反映了其在科技領域的強勁定位。 該公司今年迄今已上漲 48.77%,市值增加超過 1000 億美元。 Wedbush Securities 分析師 Dan Ives 已將阿里巴巴認定為「進入中國科技領域的最佳途徑」,理由是其在 AI 和雲端計算領域的強勁表現。
轉變 AI 開發經濟學
ZEROSEARCH 不僅僅是一種節省成本的措施; 它代表了 AI 模型訓練方式的根本轉變。 透過將訓練過程與不斷 API 調用的需求分離,阿里巴巴正在解決 AI 開發中的一個關鍵瓶頸。
減少對外部資源的依賴
ZEROSEARCH 的主要優點之一是它能夠減少對外部資源的依賴。 傳統的 AI 訓練通常需要存取大量資料,而獲取和處理這些資料的成本可能很高。 ZEROSEARCH 透過使模型能夠在內部模擬搜尋行為來減輕此問題,從而減少了對外部資料來源的依賴。
更快的迭代週期
AI 訓練成本的降低和複雜性的降低也可以加快迭代週期。 開發人員可以試驗不同的模型架構和訓練技術,而不會產生顯著的成本,從而使他們能夠快速完善和改進其模型。
啟用新的 AI 應用程式
透過降低 AI 訓練的成本,ZEROSEARCH 也可以啟用以前在經濟上不可行的新 AI 應用程式的開發。 這可能會導致醫療保健、教育和環境永續性等領域的創新。
對各個產業的潛在影響
ZEROSEARCH 的影響遠遠超出了科技產業。 更有效率和更具成本效益地訓練 AI 模型的能力可以對廣泛的產業產生變革性影響。
醫療保健
AI 已經在醫療保健中發揮著越來越重要的作用,從診斷疾病到開發新療法。 ZEROSEARCH 可以透過使研究人員能夠以大量的醫療資料訓練 AI 模型而不會產生過高的成本來加速這些努力。 這可能會導致更準確的診斷、個人化的治療計畫和更快的藥物發現。
教育
AI 也可以透過為學生提供個人化的學習體驗來徹底改變教育。 ZEROSEARCH 可以降低開發 AI 支援的教育工具的成本,使其更容易為世界各地的學校和學生所使用。 這可能會帶來更有效的教學方法、改善的學生學習成果以及更公平的教育系統。
環境永續性
AI 也可以用來解決世界上一些最緊迫的環境挑戰,例如氣候變遷和污染。 ZEROSEARCH 可以使研究人員能夠以大量的環境資料訓練 AI 模型,幫助他們識別模式並開發針對這些挑戰的解決方案。 這可能會帶來更有效的保育工作、更清潔的能源以及更永續的未來。
挑戰與考量
雖然 ZEROSEARCH 提供了顯著的優勢,但重要的是要承認與其導入相關的潛在挑戰及考量。
資料品質
ZEROSEARCH 的有效性取決於用於訓練的模擬資料的品質。 如果模擬資料不能代表真實世界的資料,則產生的模型在真實世界的情境中可能無法良好運作。 因此,至關重要的是要確保模擬資料經過仔細的策劃和驗證。
偏見
如果 AI 模型是以有偏見的資料訓練的,則可能會產生偏見。 ZEROSEARCH 也不能倖免於這個問題。 如果模擬資料包含偏見,則產生的模型也可能存在偏見。 因此,重要的是要仔細監控訓練過程並採取措施來減輕偏見。
倫理考量
AI 引發了許多倫理考量,例如隱私、安全和責任。 在開發和部署 AI 支援的應用程式時,務必解決這些考量。 這包括確保以負責任和符合倫理的方式使用 AI 模型,並且不使用它們來歧視或傷害個人或群體。
AI 訓練的未來:更易於存取和更有效率的格局
ZEROSEARCH 代表了在使 AI 訓練更易於存取和更有效率方面向前邁出的重要一步。 透過降低 AI 模型訓練的成本和複雜性,阿里巴巴正在為一個更具創新性和包容性的 AI 生態系統鋪平道路。
普及 AI 開發
ZEROSEARCH 有可能透過降低較小參與者的進入門檻來普及 AI 開發。 這可能會導致一個更加多樣化和具有競爭力的 AI 格局,更多的公司和個人為新 AI 技術的開發做出貢獻。
加速 AI 創新
AI 訓練成本的降低和複雜性的降低也可以加速 AI 創新。 開發人員可以更輕鬆地試驗不同的模型架構和訓練技術,從而實現更快的突破和新的應用。
轉變產業
ZEROSEARCH 的潛在影響遠遠超出了科技產業。 透過啟用更經濟實惠和更有效率的 AI 應用程式的開發,它可以轉變從醫療保健、教育到環境永續性等各個產業。
前進的道路:持續創新與協作
AI 訓練的未來可能涉及持續的創新與協作。 隨著 AI 技術的不斷發展,研究人員、開發人員和決策者共同努力以確保以負責任和符合倫理的方式開發和部署 AI 非常重要。
進一步最佳化
阿里巴巴和其他公司可能會繼續探索進一步最佳化 AI 訓練過程的方法。 這可能涉及開發新的演算法、硬體和軟體,可以進一步降低訓練 AI 模型的成本和複雜性。
開源計畫
開源計畫可以在促進 AI 創新方面發揮重要作用。 透過使 AI 技術更容易為公眾所使用,開源計畫可以鼓勵協作並加速新 AI 應用程式的開發。
政策與法規
政策與法規也可以在塑造 AI 的未來方面發揮重要作用。 政府可以制定鼓勵 AI 創新的政策,同時保護消費者並確保以負責任和符合倫理的方式使用 AI。
ZEROSEARCH 不僅僅是一種技術進步; 它是一種變革的催化劑,有可能在未來幾年內重塑 AI 開發和部署的格局。 它的影響將遍及各個產業,推動創新,並最終改變我們生活和工作的方式。