阿里巴巴Qwen3引領AI應用新浪潮:低成本、高效能

人工智慧 (AI) 領域正以驚人的速度不斷演進,新型模型與技術突破層出不窮。近期,阿里巴巴開源釋出了其新一代通義千問模型 Qwen3,引起了廣泛關注。相較於其他領先模型,Qwen3 擁有更小的參數規模、更低的成本以及更強大的效能,使其在全球 AI 舞台上成為一個強勁的競爭者。

Qwen3 在中國率先採用混合推理模型,它將效能提升與成本降低完美結合。Qwen3 總共擁有 2350 億個參數,相較於其他具有類似功能的模型,Qwen3 在部署時所需的資源顯著減少。這種高性價比讓 Qwen3 成為對希望充分利用大型語言模型力量,但又不想花費鉅額資金的組織來說,是一個極具吸引力的選擇。

賦能AI Agent與應用程式

Qwen3 的主要亮點之一,是它有潛力加速 AI Agent 和大型語言模型應用程式的開發與部署。在模型 Agent 能力的評估中,Qwen3 取得了令人印象深刻的成績,超越了其他頂級模型。這表明 Qwen3 可以降低開發和部署 AI Agent 的門檻,從而可能引發創新應用程式的激增。

AI Agent中日益增長的工具調用能力需求

AI Agent 越來越多地被用於自動化複雜任務和與現實世界互動。AI Agent 所需的能力取決於其設計執行的任務的複雜性和自主性。

一個強大的 AI Agent 系統通常需要底層模型具備以下能力:

  • 基礎語言理解與生成: 準確理解指令、理解上下文並生成自然語言回應的能力。

  • 工具使用與調用: 理解和利用外部工具(包括 API)來完成特定任務的能力。

  • 推理與規劃: 將複雜目標分解為更小的子任務,並以邏輯順序執行它們的能力。

Qwen3 解決了 AI Agent 中對改進工具調用能力的迫切需求。無論是在思考模式還是非思考模式下,Qwen3 都能夠精確地整合外部工具,使其成為複雜的基於 Agent 的任務的領先開源模型。

在模型 Agent 能力的評估中,Qwen3 取得了高分,超越了其他頂級模型。這意味著開發和部署 AI Agent 的門檻顯著降低。

Qwen3 原生支援 MCP 協定,並具備強大的工具調用能力。結合 Qwen-Agent 框架(該框架封裝了工具調用範本和解析器),它簡化了開發過程,並使 Agent 能夠在行動和電腦裝置上高效運作。開發人員可以基於 MCP 配置文件定義可用的工具,並使用 Qwen-Agent 框架或其他自定義工具來整合它們。這使得能夠快速開發具有知識庫和工具使用能力的智能 Agent。

此外,Qwen3 在基礎語言理解與生成以及推理能力方面也表現出色。

這意味著,在模型能力相當的情況下,Agent 和 AI 應用產業調用模型的成本更低,調用也更方便,這必將促進更多新型 Agent 和 AI 應用程式的出現。

對開源的承諾

阿里巴巴透過提供多種 Qwen3 模型,重申了其對開源社群的承諾。這包括兩個具有 300 億和 2350 億個參數的混合專家 (MoE) 模型,以及六個具有不同大小的密集模型。

300 億參數的 MoE 模型實現了顯著的效能提升,提供了與上一代 Qwen2.5-32B 模型相當的效能。密集模型也表現出改進的效能,即使是較小的模型也取得了令人印象深刻的結果。

由於所有 Qwen3 模型都是混合推理模型,因此可以根據需要設定 API 來設定’思考預算’(即,深入思考的預期最大 Token 數量),以執行不同程度的思考,並靈活地滿足 AI 應用程式和不同場景對效能和成本的多樣化需求。中小企業和 AI 開發人員可以根據他們的需求靈活地選擇模型,這必將降低使用大型模型的門檻和成本。這些資金和人員非常有限的團隊可以將更多的資源和精力投入到市場和使用者需求的挖掘上,以便他們能夠開發出更具創新性的應用程式。

阿里巴巴的技術基礎

經過 16 年的發展,阿里巴巴已全面重建了一個從底層硬體到運算、儲存、網路、資料處理、模型訓練和推理平台的完整技術架構體系,使其成為亞太地區領先的雲端運算平台。阿里巴巴也是全球首批投資於大型模型研究的科技公司之一。

此前,周靖人 (Zhou Jingren) 在接受媒體採訪時表示,大型模型的開發離不開雲端系統的支援。無論是訓練還是推理,大型模型的每一次突破,從表面上看,都是模型能力的進化,但背後是整個雲端運算以及資料和工程平台的全面合作和升級。多模態也是通往通用人工智慧 (AGI) 的重要途徑。

國際認可

Qwen3 的發布在全球範圍內引起了關注。在阿里巴巴發布 Qwen 3 之後,伊隆·馬斯克 (Elon Musk) 在社交媒體平台 X 上表示,Grok 3.5 的早期 Beta 版本將於下週發布給 SuperGrok 訂閱者,聲稱它是第一個可以準確回答有關火箭引擎或電化學技術問題的 AI。

驅動創新和可訪問性

清華大學人工智慧研究院常務副院長、歐洲人文和自然科學院外籍院士孫茂松表示,近年來,中國在人工智慧發展方面做出了重要貢獻,特別是在大型模型領域。 DeepSeek 的出現和通義千問的一系列開源產品極大地促進了國內大型模型的開源路線,這無疑對緩解技術壟斷、促進技術公平和增強人工智慧的包容性具有重要意義。

目前,國內外開源社群中 Qwen 衍生模型的數量已超過 10 萬個,超過了 Llama 系列的衍生模型,通義千問 Qwen 名列全球最大的生成語言模型群組。根據 Huggingface 於 2025 年 2 月 10 日發布的最新全球開源大型模型列表,前十大開源大型模型均為基於通義千問 Qwen 開源模型的衍生模型。

孫茂松認為,這意味著中國的大型模型文化已獲得國際認可,這是一種文化轉變。這非常有價值,代表了對中國大型模型發展和技術的認可。