人工智能领域日新月异,新型模型和技术进步层出不穷。近期,阿里巴巴开源了其新一代通义千问模型——Qwen3,引起了广泛关注。相较于其他领先模型,Qwen3拥有更小的参数规模、更低的成本和更高的性能,使其在全球人工智能领域中成为强有力的竞争者。
Qwen3作为中国领先的混合推理模型,在性能提升和成本降低方面实现了引人注目的结合。它拥有总计2350亿个参数,相较于其他具有类似功能的模型,其部署所需的资源显著减少。这种成本效益使得Qwen3成为希望利用大型语言模型的力量,但又不想承担过高费用的组织的理想选择。
赋能AI Agent和应用
Qwen3的主要亮点之一是其加速AI Agent和大型语言模型应用开发和部署的潜力。在模型Agent能力评估中,Qwen3取得了令人印象深刻的分数,超过了其他顶级模型。这表明Qwen3可以降低开发和部署AI Agent的门槛,从而可能引发创新应用的激增。
AI Agent对工具调用能力日益增长的需求
AI Agent越来越多地被用于自动化复杂任务和与现实世界互动。AI Agent所需的能力取决于其设计的任务的复杂性和自主性。
一个强大的AI Agent系统通常需要底层模型具备以下能力:
基础的语言理解和生成能力: 能够准确理解指令、理解上下文并生成自然语言响应。
工具的使用和调用能力: 能够理解和利用外部工具,包括API,以完成特定任务。
推理和规划能力: 能够将复杂的目标分解为更小的子任务,并按逻辑顺序执行它们。
Qwen3解决了AI Agent对改进工具调用能力的关键需求。它可以在思考和非思考模式下精确地集成外部工具,使其成为复杂Agent任务的领先开源模型。
在模型Agent能力评估中,Qwen3取得了很高的分数,超过了其他顶级模型。这标志着开发和部署AI Agent的门槛显著降低。
Qwen3原生支持MCP协议,并具有强大的工具调用能力。结合Qwen-Agent框架(该框架封装了工具调用模板和解析器),它简化了开发过程,并实现了在移动和计算机设备上高效的Agent操作。开发人员可以根据MCP配置文件定义可用的工具,并使用Qwen-Agent框架或其他自定义工具集成它们。这使得能够快速开发具有知识库和工具使用能力的智能Agent。
此外,Qwen3在基础语言理解和生成以及推理能力方面表现出色。
这意味着,在模型能力相当的情况下,Agent和AI应用行业调用模型的成本更低,调用也更方便,这将不可避免地促进更多新的Agent和AI应用的出现。
对开源的承诺
阿里巴巴通过提供各种Qwen3模型,重申了其对开源社区的承诺。这包括两个具有300亿和2350亿参数的混合专家(MoE)模型,以及六个具有不同大小的密集模型。
300亿参数的MoE模型实现了显著的性能提升,提供了与上一代Qwen2.5-32B模型相当的性能。密集模型也展示了改进的性能,即使是较小的模型也取得了令人印象深刻的结果。
因为所有Qwen3模型都是混合推理模型,所以可以根据需要设置API来设置’思考预算’(即,深入思考的预期最大token数量),以执行不同程度的思考,并灵活地满足AI应用和不同场景对性能和成本的多样化需求。中小型企业和AI开发人员可以根据自己的需求灵活地选择模型,这将不可避免地降低使用大型模型的门槛和成本。这些资金和人员非常有限的团队可以将更多的资源和精力投入到市场和用户需求和痛点的挖掘中,从而开发出更具创新性的应用程序。
阿里巴巴的技术基础
经过16年的发展,阿里巴巴已经全面重建了一个从底层硬件到计算、存储、网络、数据处理、模型训练和推理平台的完整技术架构系统,使其成为亚太地区领先的云计算平台。阿里巴巴也是世界上最早投资于大型模型研究的科技公司之一。
此前,周靖人接受媒体采访时表示,大型模型的开发离不开云系统的支持。无论是训练还是推理,大型模型的每一次突破,表面上看是模型能力的进化,但背后是整个云计算和数据工程平台的全面合作和升级。多模态也是通往AGI的重要途径。
国际认可
Qwen3的发布在全球范围内引起了关注。在阿里巴巴发布Qwen 3之后,埃隆·马斯克在社交媒体平台X上表示,Grok 3.5的早期Beta版本将于下周发布给SuperGrok订阅者,声称它是第一个能够准确回答有关火箭发动机或电化学技术问题的AI。
推动创新和可访问性
清华大学人工智能研究院常务副院长、欧洲人文和自然科学院外籍院士孙茂松表示,近年来,中国为人工智能的发展做出了巨大贡献,尤其是在大型模型领域。DeepSeek的出现和通义千问的一系列开源产品极大地推动了国内大型模型的开源路线,这无疑对于缓解技术垄断、促进技术公平和增强人工智能的包容性具有重要意义。
目前,国内外开源社区中Qwen衍生模型的数量已超过10万个,超过了Llama系列的衍生模型,通义千问Qwen名列全球最大的生成语言模型组。根据Huggingface 2025年2月10日发布的最新全球开源大型模型列表,排名前十的开源大型模型都是基于通义千问Qwen开源模型的衍生模型。
孙茂松认为,这意味着中国的大型模型文化已经得到国际认可,这是一种文化转变。这非常有价值,代表着对中国大型模型的发展和技术的认可。