Qwen3: IA Mais Barata e Potente da Alibaba

O cenário da IA está em constante evolução, com novos modelos e avanços surgindo em ritmo acelerado. Entre os desenvolvimentos recentes, o lançamento de código aberto do modelo Tongyi Qianwen de próxima geração da Alibaba, o Qwen3, chamou atenção significativa. Ostentando um tamanho de parâmetro menor, custos reduzidos e desempenho aprimorado em comparação com outros modelos líderes, o Qwen3 se posicionou como um forte concorrente no cenário global de IA.

O Qwen3 se destaca como um modelo pioneiro de raciocínio híbrido na China, oferecendo uma combinação atraente de desempenho aprimorado e custos reduzidos. Com um total de 235 bilhões de parâmetros, ele requer significativamente menos recursos para implantação em comparação com outros modelos com capacidades semelhantes. Essa relação custo-benefício torna o Qwen3 uma opção atraente para organizações que desejam aproveitar o poder de grandes modelos de linguagem sem gastar muito.

Capacitação de Agentes e Aplicações de IA

Um dos principais destaques do Qwen3 é seu potencial para acelerar o desenvolvimento e a implantação de agentes de IA e aplicações de grandes modelos de linguagem. Em avaliações das capacidades de agentes de modelo, o Qwen3 alcançou pontuações impressionantes, superando outros modelos de primeira linha. Isso sugere que o Qwen3 pode diminuir a barreira de entrada para desenvolver e implantar agentes de IA, levando potencialmente a um aumento nas aplicações inovadoras.

A Crescente Demanda por Capacidades de Chamada de Ferramentas em Agentes de IA

Os agentes de IA estão sendo cada vez mais usados para automatizar tarefas complexas e interagir com o mundo real. As capacidades exigidas de um agente de IA dependem da complexidade e autonomia das tarefas que ele foi projetado para executar.

Um sistema de agente de IA robusto normalmente requer as seguintes capacidades do modelo subjacente:

  • Compreensão e geração básica de linguagem: A capacidade de interpretar instruções com precisão, entender o contexto e gerar respostas em linguagem natural.

  • Uso e chamada de ferramentas: A capacidade de entender e utilizar ferramentas externas, incluindo APIs, para realizar tarefas específicas.

  • Raciocínio e planejamento: A capacidade de decompor objetivos complexos em subtarefas menores e executá-las em uma sequência lógica.

O Qwen3 aborda a necessidade crítica de capacidades aprimoradas de chamada de ferramentas em agentes de IA. Ele pode integrar ferramentas externas com precisão, tanto nos modos de pensamento quanto nos de não pensamento, tornando-o um modelo de código aberto líder para tarefas complexas baseadas em agentes.

Em avaliações das capacidades de agentes de modelo, o Qwen3 alcançou uma pontuação alta, superando outros modelos de primeira linha. Isso significa uma redução significativa nas barreiras de entrada para desenvolver e implantar agentes de IA.

O Qwen3 oferece suporte nativo ao protocolo MCP e possui capacidades robustas de chamada de ferramentas. Combinado com a estrutura Qwen-Agent, que encapsula modelos e analisadores de chamada de ferramentas, ele simplifica o processo de desenvolvimento e permite operações eficientes de agentes em dispositivos móveis e computadores. Os desenvolvedores podem definir ferramentas disponíveis com base em arquivos de configuração MCP e integrá-las usando a estrutura Qwen-Agent ou outras ferramentas personalizadas. Isso permite o rápido desenvolvimento de agentes inteligentes com bases de conhecimento e capacidades de uso de ferramentas.

Além disso, o Qwen3 apresenta um forte desempenho na compreensão e geração básica de linguagem, bem como habilidades de raciocínio.

Isso significa que, com capacidades de modelo equivalentes, o custo de chamar modelos para agentes e indústrias de aplicações de IA é menor, e a chamada é mais conveniente, o que inevitavelmente promoverá o surgimento de mais novos agentes e aplicações de IA.

Um Compromisso com o Código Aberto

A Alibaba reafirmou seu compromisso com a comunidade de código aberto, oferecendo uma gama diversificada de modelos Qwen3. Isso inclui dois modelos Mixture-of-Experts (MoE) com 30 bilhões e 235 bilhões de parâmetros, bem como seis modelos densos com tamanhos variados.

O modelo MoE de 30 bilhões de parâmetros alcança um aumento significativo no desempenho, oferecendo um desempenho comparável ao modelo Qwen2.5-32B de geração anterior. Os modelos densos também demonstram desempenho aprimorado, com até mesmo os modelos menores alcançando resultados impressionantes.

Como todos os modelos Qwen3 são modelos de raciocínio híbrido, as APIs podem ser configuradas conforme necessário para definir ‘orçamentos de pensamento’ (ou seja, o número máximo esperado de tokens para pensamento aprofundado) para executar diferentes graus de pensamento e atender de forma flexível às diversas necessidades de aplicações de IA e diferentes cenários de desempenho e custo. Pequenas e médias empresas e desenvolvedores de IA podem escolher modelos de forma flexível de acordo com suas necessidades, o que inevitavelmente reduzirá o limite e o custo de uso de grandes modelos. Essas equipes com fundos e pessoal muito limitados podem colocar mais recursos e energia no mercado e na exploração das necessidades e pontos problemáticos dos usuários, para que possam desenvolver aplicações mais inovadoras.

A Fundação Tecnológica da Alibaba

Após 16 anos de desenvolvimento, a Alibaba reconstruiu de forma abrangente um sistema de arquitetura de tecnologia full-stack, desde hardware subjacente até computação, armazenamento, rede, processamento de dados, treinamento de modelos e plataformas de raciocínio, tornando-se a plataforma de computação em nuvem líder na região da Ásia-Pacífico. A Alibaba também é uma das primeiras empresas de tecnologia do mundo a investir em pesquisa de grandes modelos.

Anteriormente, Zhou Jingren afirmou em uma entrevista à mídia que o desenvolvimento de grandes modelos é inseparável do suporte do sistema de nuvem. Seja treinamento ou raciocínio, cada avanço em grandes modelos, na superfície, é a evolução das capacidades do modelo, mas por trás disso está a cooperação abrangente e a atualização de toda a computação em nuvem e plataforma de dados e engenharia. A multimodalidade também é uma forma importante de AGI.

Reconhecimento Internacional

O lançamento do Qwen3 chamou a atenção em escala global. Após o lançamento do Qwen 3 da Alibaba, Elon Musk afirmou na plataforma de mídia social X que uma versão beta inicial do Grok 3.5 seria lançada para assinantes SuperGrok na próxima semana, alegando que é a primeira IA que pode responder com precisão a perguntas sobre motores de foguete ou tecnologia eletroquímica.

Impulsionando a Inovação e a Acessibilidade

Sun Maosong, Vice-Presidente Executivo do Instituto de Inteligência Artificial da Universidade de Tsinghua e Acadêmico Estrangeiro da Academia Europeia de Humanidades e Ciências Naturais, afirmou que, nos últimos anos, a China tem dado fortes contribuições para o desenvolvimento da inteligência artificial, particularmente no campo de grandes modelos. O surgimento do DeepSeek e da série de produtos de código aberto do Tongyi Qianwen promoveram muito a rota de código aberto de grandes modelos domésticos, o que é, sem dúvida, de grande importância para aliviar monopólios tecnológicos, promover a equidade tecnológica e aumentar a inclusão da inteligência artificial.

Atualmente, o número de modelos derivados do Qwen em comunidades de código aberto no país e no exterior excedeu 100.000, superando a série Llama de modelos derivados, e o Tongyi Qianwen Qwen se classifica como o maior grupo de modelos de linguagem generativa do mundo. De acordo com a lista global mais recente de grandes modelos de código aberto do Huggingface em 10 de fevereiro de 2025, os dez principais grandes modelos de código aberto são todos modelos derivados baseados em modelos de código aberto Tongyi Qianwen Qwen.

Sun Maosong acredita que isso significa que a cultura de grandes modelos da China foi reconhecida internacionalmente, o que é uma mudança cultural. Isso é muito valioso e representa o reconhecimento do desenvolvimento e da tecnologia dos grandes modelos da China.