阿里巴巴發布 Qwen3:突破性開源 LLM

阿里巴巴推出了 Qwen3,這是其最新的開源大型語言模型 (LLM),為人工智慧創新樹立了新的基準。 這個系列的 LLM 為開發人員提供了前所未有的靈活性,使他們能夠在各種設備上部署下一代 AI。 從智慧型手機和智慧眼鏡到自動駕駛汽車和機器人,Qwen3 準備徹底改變 AI 整合到我們日常生活中的方式。

Qwen3 系列:模型深入探討

Qwen3 系列包含六個密集模型和兩個混合專家 (MoE) 模型。 這些模型可滿足各種計算需求和應用場景。 密集模型,範圍從 0.6B 到 32B 參數,在效能和效率之間取得了平衡。 MoE 模型,具有 30B(3B 活動)和 235B(22B 活動)參數,為複雜任務提供增強的功能。 這種多樣化的選擇使開發人員能夠選擇最適合其特定要求的模型。

密集模型:Qwen3 的主力

Qwen3 系列中的密集模型專為通用 AI 任務而設計。 他們擅長語言理解、生成和翻譯。 0.6B 和 1.7B 參數模型非常適合資源受限的設備,例如智慧型手機和穿戴式設備。 4B、8B、14B 和 32B 模型提供了越來越複雜的功能,適用於要求更高的應用程式。

MoE 模型:釋放進階 AI 功能

Qwen3 中的 MoE 模型專為複雜的推理和問題解決任務而設計。 它們利用混合專家架構,其中模型的不同部分專注於任務的不同方面。 這使得模型能夠以更高的效率和準確性處理複雜的問題。 30B(3B 活動)模型在效能和計算成本之間取得了平衡,而 235B(22B 活動)模型為最具挑戰性的 AI 任務提供了最先進的功能。

混合推理:一種新穎的 AI 方法

Qwen3 標誌著阿里巴巴進入混合推理模型領域,將傳統 LLM 功能與先進的動態推理相結合。 這種創新的方法使模型能夠在複雜任務的不同思維模式之間無縫轉換。 它可以根據手頭任務的特定要求動態調整其推理過程,從而產生更準確和高效的解決方案。

傳統 LLM 功能

Qwen3 保留了傳統 LLM 的核心功能,例如語言理解、生成和翻譯。 它可以處理和生成多種語言的文字、回答問題、總結文件以及執行其他常見的 NLP 任務。 這些功能構成了 Qwen3 混合推理方法的基礎。

動態推理:適應複雜性

Qwen3 的動態推理組件允許模型根據任務的複雜性調整其推理過程。 對於簡單的任務,它可以依賴其預先訓練的知識並執行直接推斷。 對於更複雜的任務,它可以參與更複雜的推理過程,例如規劃、問題分解和假設檢驗。 這種適應性使 Qwen3 能夠處理廣泛的 AI 挑戰。

Qwen3 的主要優勢

與現有的開源 LLM 相比,Qwen3 系列具有多項主要優勢。 這些包括多語言支援、原生模型上下文協定 (MCP) 支援、可靠的函數呼叫以及在各種基準測試中表現出色。

多語言支援:打破語言障礙

Qwen3 支援 119 種語言和方言,使其成為可用的最多語言的開源 LLM 之一。 這種廣泛的語言支援使開發人員能夠建構可以滿足全球受眾的 AI 應用程式。 它可以理解和生成各種語言的文字,非常適合機器翻譯、多語言聊天機器人和全球內容建立等應用程式。

原生 MCP 支援:增強代理 AI 功能

Qwen3 具有對模型上下文協定 (MCP) 的原生支援,從而實現更強大和可靠的函數呼叫。 這對於代理 AI 應用程式尤其重要,在這些應用程式中,AI 系統需要與外部工具和服務交互才能完成任務。 MCP 提供了一種標準化的方式供 AI 模型與這些工具通信,確保無縫整合和可靠的效能。

函數呼叫:與外部工具的無縫整合

Qwen3 的可靠函數呼叫功能使其能夠與外部工具和服務無縫整合。 這使開發人員能夠建構 AI 代理,這些代理可以透過利用各種外部系統的功能來執行複雜的任務。 例如,AI 代理可以使用函數呼叫來存取天氣 API、從資料庫中檢索資訊或控制機器手臂。

卓越效能:超越先前的模型

Qwen3 在數學、編碼和邏輯推理的基準測試中超越了先前的 Qwen 模型。 它還擅長生成創意寫作、角色扮演和進行自然發音的對話。 這些改進使 Qwen3 成為廣泛 AI 應用程式的強大工具。

Qwen3 適用於開發人員:賦能創新

Qwen3 為開發人員提供了對推理持續時間的細粒度控制,最高可達 38,000 個 token,從而實現了智慧效能和計算效率之間的最佳平衡。 這種靈活性使開發人員能夠根據特定的應用程式要求定制模型的行為。

推理持續時間控制:最佳化效能

控制推理持續時間的能力使開發人員能夠針對不同的任務最佳化 Qwen3 的效能。 對於需要更深入推理的任務,開發人員可以增加推理持續時間,以允許模型探索更多可能性。 對於需要更快回應的任務,開發人員可以減少推理持續時間以減少延遲。

Token 限制:平衡準確性和效率

38,000 個 token 的限制在準確性和效率之間取得了平衡。 它允許模型在做出決策時考慮大量上下文,同時仍保持合理的計算成本。 這使得 Qwen3 適用於廣泛的應用程式,從長篇文字生成到複雜的問題解決。

使用 Qwen3-235B-A22B 實現具有成本效益的部署

與其他最先進的模型相比,MoE 模型 Qwen3-235B-A22B 顯著降低了部署成本。 它在一個包含 36 兆個 token 的龐大資料集上進行了訓練,是其前身 Qwen2.5 的兩倍大小,它以一小部分的成本提供了卓越的效能。

降低部署成本:普及 AI

Qwen3-235B-A22B 較低的部署成本使其更容易被資源有限的開發人員和組織使用。 這普及了 AI 創新,使更廣泛的個人和團體能夠建構和部署先進的 AI 應用程式。

大規模訓練資料集:增強效能

包含 36 兆個 token 的大規模訓練資料集使 Qwen3-235B-A22B 能夠學習語言資料中更複雜的模式和關係。 這提高了各種 AI 任務的效能。

行業基準成就

阿里巴巴的最新模型在各種行業基準測試中取得了出色的成績,包括 AIME25(數學推理)、LiveCodeBench(編碼能力)、BFCL(工具使用和函數處理)和 Arena-Hard(用於指令追蹤 LLM 的基準測試)。 這些成就展示了 Qwen3 在 AI 關鍵領域的卓越能力。

AIME25:掌握數學推理

AIME25 基準測試評估模型解決複雜數學問題的能力。 Qwen3 在此基準測試中的強勁效能突顯了其邏輯推理能力以及應用數學概念解決現實世界問題的能力。

LiveCodeBench:擅長編碼任務

LiveCodeBench 基準測試評估模型生成和理解程式碼的能力。 Qwen3 在此基準測試中的強勁效能證明了其在程式設計語言方面的熟練程度以及協助開發人員完成編碼任務的能力。

BFCL:精通工具使用和函數處理

BFCL 基準測試衡量模型使用外部工具和處理函數的能力。 Qwen3 在此基準測試中的強勁效能突顯了其與外部系統整合的能力以及透過利用各種工具的功能來執行複雜任務的能力。

Arena-Hard:領先於指令追蹤

Arena-Hard 基準測試評估模型追蹤複雜指令的能力。 Qwen3 在此基準測試中的強勁效能證明了其理解和執行詳細指令的能力,使其成為需要精確控制和協調的應用程式的理想選擇。

訓練過程:四階段方法

為了開發這種混合推理模型,阿里巴巴採用了四階段訓練過程,包括長鏈思維 (CoT) 冷啟動、基於推理的強化學習 (RL)、思維模式融合和通用強化學習。

長鏈思維 (CoT) 冷啟動:建立基礎

長鏈思維 (CoT) 冷啟動階段涉及訓練模型為其推理過程生成詳細的解釋。 這有助於模型更深入地理解問題並確定解決問題所需的關鍵步驟。

基於推理的強化學習 (RL):完善推理過程

基於推理的強化學習 (RL) 階段涉及訓練模型透過試錯來改進其推理過程。 模型因生成正確答案而獲得獎勵,並因生成不正確答案而受到懲罰。 這有助於模型學習哪種推理策略最有效。

思維模式融合:結合不同的方法

思維模式融合階段涉及結合不同的推理方法來建立混合推理模型。 這使模型能夠利用不同方法的優勢來解決複雜的問題。

通用強化學習:最佳化整體效能

通用強化學習階段涉及訓練模型來最佳化其在廣泛任務中的整體效能。 這有助於模型概括其知識並適應新的和未見過的情況。

可用性和存取

Qwen3 現在可以透過 Hugging Face、GitHub 和 ModelScope 免費下載。 也可以透過 chat.qwen.ai 直接存取。 API 存取將很快透過阿里巴巴的 AI 模型開發平台 Model Studio 提供。 此外,Qwen3 作為阿里巴巴旗艦 AI 超級助手應用程式 Quark 背後的核心技術。

Hugging Face、GitHub 和 ModelScope:開放存取創新

Qwen3 在 Hugging Face、GitHub 和 ModelScope 上的可用性為全球開發人員和研究人員提供了對模型的開放存取。 這促進了 AI 領域的協作和加速了創新。

chat.qwen.ai:與 Qwen3 直接互動

chat.qwen.ai 平台允許使用者直接與 Qwen3 互動,從而提供模型功能的實際操作體驗。 這使開發人員能夠在將模型整合到自己的應用程式中之前對其進行測試和評估。

Model Studio:簡化 AI 開發

即將透過阿里巴巴 Model Studio 平台提供的 API 存取將為開發人員提供一個簡化的環境,用於建構和部署由 Qwen3 提供支援的 AI 應用程式。 這將進一步加速 Qwen3 的採用及其整合到更廣泛的產品和服務中。

Quark:為阿里巴巴的 AI 超級助手提供動力

Qwen3 作為阿里巴巴旗艦 AI 超級助手應用程式 Quark 背後的核心技術的整合,證明了該公司致力於利用 AI 來增強其產品和服務。 這種整合將為使用者提供更智慧和直觀的體驗,並由 Qwen3 的先進功能提供支援。