IA Chinesa Open Source: Além da DeepSeek

A Convergência do Open Source Chinês

No início de fevereiro, quando o modelo chinês de grande porte open source DeepSeek liderou os rankings de downloads de lojas de aplicativos em 140 países e regiões em todo o mundo, a OpenAI acusou publicamente a DeepSeek de usar dados destilados do ChatGPT sem permissão.

Em vez de salvar a reputação da OpenAI, essa acusação foi recebida com ridículo generalizado de pesquisadores em todo o mundo.

Agora, outro concorrente, abraçando totalmente o buff de “destilação”, surgiu.

Em 13 de abril, a Kunlun Wanwei lançou os modelos da série Skywork-OR1 (Open Reasoner 1), superando o Qwen-32B da Alibaba na mesma escala e alinhando-se com o DeepSeek-R1.

Como pode a Kunlun Wanwei, uma empresa com recursos financeiros limitados, criar um modelo de grande porte de nível SOTA? A explicação oficial é que seus modelos são baseados em DeepSeek-R1-Distill-Qwen-7B e DeepSeek-R1-Distill-Qwen-32B.

Como os nomes sugerem, os modelos DeepSeek destilaram os modelos da série Qwen da Alibaba.

Ao alavancar excelentes modelos open source, a Kunlun Wanwei também está contribuindo para a comunidade open source. Ao contrário da DeepSeek, que apenas abriu o código dos pesos do modelo, a Kunlun Wanwei também abriu o código de seus conjuntos de dados e código de treinamento, alinhando-se mais estreitamente com o conceito de “verdadeiro open source”. Isso significa que qualquer usuário pode tentar replicar seu processo de treinamento de modelo.

A conquista da Kunlun Wanwei demonstra o aspecto mais importante do open source: ele não apenas fornece aos usuários um produto gratuito e facilmente disponível, mas também permite que mais desenvolvedores se apoiem nos ombros de predecessores, avançando a tecnologia de forma rápida e econômica.

Na verdade, em meio às discussões da indústria do ano passado sobre o gargalo no pré-treinamento de modelos grandes, o ritmo de iteração de modelos chineses grandes acelerou este ano, com mais e mais empresas investindo em open source.

O Tongyi Qianwen da Alibaba Cloud abriu o código de seu novo modelo visual Qwen2.5-VL na véspera do Ano Novo Chinês e lançou e abriu o código de seu novo modelo de raciocínio QwQ-32B no início de março, liderando a lista de tendências da comunidade global mainstream de IA open source Hugging Face no dia em que foi aberto o código.

A Stepwise então abriu o código de três modelos multimodais grandes em cerca de um mês, o mais recente dos quais é o modelo de imagem para vídeo Step-Video-TI2V, que suporta a geração de vídeos com amplitude de movimento e movimento de lente controláveis, e também vem com certas capacidades de geração de efeitos especiais.

A Zhipu anunciou em abril que abriria o código da série GLM 32B/9B, cobrindo modelos básicos, de raciocínio e contemplativos, todos sob o contrato de licença MIT.

Até a Baidu, que antes era de código fechado, anunciou que abriria totalmente o código do modelo grande Wenxin em 30 de junho.

Comparado com a crescente prosperidade do ecossistema doméstico de open source, as empresas americanas de modelos grandes ainda se concentram principalmente em código fechado, o que deu aos modelos chineses grandes uma rara oportunidade de ir para o exterior. A DeepSeek permitiu que a empresa indonésia de educação Ruangguru otimizasse seu modelo de ensino a baixo custo; A empresa singapurense de tecnologia de viagens B2B Atlas integrou o Qwen em seu sistema inteligente de atendimento ao cliente para obter suporte multilíngue 24 horas por dia, 7 dias por semana.

Por Que Código Fechado nos EUA, Open Source na China?

A tendência para o código fechado na indústria de IA dos EUA e a crescente abertura da IA chinesa são os resultados inevitáveis dos diferentes ambientes de desenvolvimento de IA nos dois países.

A indústria de IA dos EUA é liderada principalmente por gigantes da tecnologia e VCs (capitalistas de risco), que têm enormes expectativas de retornos de capital da IA. Portanto, as empresas de modelos de IA dos EUA geralmente têm uma forte crença na tecnologia, ou seja, buscar a liderança tecnológica, alcançar um certo grau de monopólio de mercado e, em seguida, criar enormes lucros, e seu ecossistema é naturalmente inclinado ao código fechado.

Tomando a história de desenvolvimento da OpenAI como um exemplo, ela começou como uma entidade sem fins lucrativos durante sua criação, mas desde então se tornou cada vez mais fechada. O GPT-1 era totalmente open source, o GPT-2 era parcialmente open source e encontrou oposição antes de ser totalmente open source, o GPT-3 oficialmente passou a ser de código fechado e, em seguida, o GPT-4 fortaleceu ainda mais a estratégia de código fechado, com arquitetura de modelo e dados de treinamento completamente confidenciais, e até mesmo restringindo a frequência de chamadas de API de usuários corporativos.

Embora a OpenAI tenha dito que fechar o código é baseado na conformidade e no controle do abuso da tecnologia, o mercado geralmente acredita que o evento marcante da mudança da OpenAI para o código fechado foi sua chegada a uma cooperação de cem bilhões de dólares com a Microsoft, incorporando o GPT-3 aos serviços de nuvem Azure para formar um ciclo fechado de “tecnologia-capital”.

Quando a Microsoft divulgou pela primeira vez seu investimento na OpenAI em seu relatório financeiro em outubro do ano passado, disse: “Investimos na OpenAIGlobal, LLC, com um compromisso total de investimento de US$ 13 bilhões, e o investimento é contabilizado usando o método de equivalência patrimonial”.

O chamado método de equivalência patrimonial também pode ser entendido como o investimento da Microsoft na OpenAI com o objetivo de obter retornos em vez de pura pesquisa de caridade. Obviamente, a venda de APIs de alto preço da OpenAI por meio de um ecossistema de código fechado é sua maior fonte de receita atual e se tornou o maior obstáculo para a falta de vontade da OpenAI de abrir o código.

A Anthropic, que foi fundada a partir da “divisão” da OpenAI, está determinada a seguir a rota do código fechado desde o início, e seu grande modelo de produto Claude adotou totalmente o modelo de código fechado.

Até mesmo o Llama da META, o único líder de open source nos Estados Unidos, adicionou duas cláusulas anti-amigo ao abrir o código:

  1. Os modelos open source não podem ser usados para produtos e serviços com mais de 700 milhões de usuários ativos mensais antes que a META os aprove.
  2. O conteúdo de saída dos modelos Llama não pode ser usado para treinar e melhorar outros modelos de linguagem grandes.

Pode-se ver que, mesmo para modelos open source, o objetivo principal da Meta ainda é construir seu próprio ecossistema de IA em vez de inclusão técnica.

Os Estados Unidos escolheram uma estratégia de IA baseada em código fechado com open source como suplemento no nível de capital, o que pode ser considerado como considerações puramente comerciais. Em contraste, o design de cima para baixo da China atribuiu importância ao open source desde o início, refletindo um caminho de primeiro a indústria sob o conceito de controle independente.

Já em 2017, o governo chinês lançou o “Plano de Desenvolvimento de Inteligência Artificial de Nova Geração”, que propôs claramente acelerar a integração profunda da IA com a economia e a sociedade, e implantar para construir a vantagem de pioneiro do desenvolvimento de IA. Em 2021, o conteúdo relacionado a open source foi explicitamente incluído no “14º Plano Quinquenal” da China, o que desencadeou a promoção ativa da inovação tecnológica pelos governos locais.

Mei Hong, um acadêmico da Academia Chinesa de Ciências, disse uma vez que o futuro desenvolvimento de modelos de linguagem deve depender de plataformas open source. Somente em um ambiente aberto a segurança e a confiabilidade dos uploads de dados e da integração de negócios para usuários em vários setores podem ser garantidas.

O “Plano de Ação Especial para Capacitação Digital de Pequenas e Médias Empresas (2025-2027)” emitido pelo Ministério da Indústria e Tecnologia da Informação e outros quatro departamentos em dezembro do ano passado apoia claramente a Fundação Open Atom Open Source para estabelecer um “Projeto Especial Open Source de IA para Pequenas e Médias Empresas” para fornecer estruturas de treinamento reproduzíveis e fáceis de promover, ferramentas de teste e outros recursos para diminuir o limite técnico para as empresas.

Um problema mais realista é que, devido ao potencial bloqueio tecnológico pelos Estados Unidos, a China não pode simplesmente ser uma seguidora no campo da IA, mas deve construir um ecossistema doméstico independente. Construir outro ecossistema de código fechado sob o ecossistema que os Estados Unidos já construíram com código fechado como foco principal é o mesmo que construir um carro atrás de portas fechadas. Somente um ecossistema open source pode ajudar rapidamente no desenvolvimento da indústria de IA.

Além do apoio de alto nível, vários governos locais também fizeram investimentos reais em dinheiro no ecossistema open source.

O Fundo Z, estabelecido em conjunto pela Zhipu e pela Beijing State-owned Assets, que se concentra no investimento no ecossistema de modelos grandes, anunciou que investiria 300 milhões de yuans para apoiar o desenvolvimento da comunidade open source de IA em todo o mundo. Qualquer projeto de inicialização baseado em modelos open source (não limitado aos modelos open source da Zhipu) pode se candidatar.

A divergência entre a China e os Estados Unidos em suas estratégias de open source e código fechado para a indústria de IA é essencialmente uma diferença fundamental na lógica de desenvolvimento. Os Estados Unidos são impulsionados pelo capital, e as demandas de busca de lucro de gigantes da tecnologia e VCs geraram um ecossistema de código fechado de “monopólio tecnológico - realização de alto preço”. Mesmo que a Meta tente abrir o código, é difícil escapar das algemas das barreiras comerciais. A China confia no design de alto nível, com “equidade tecnológica + colaboração industrial” como seu conceito central, e constrói um ecossistema aberto por meio da capacitação de políticas, tornando o open source uma infraestrutura básica para diminuir os limites técnicos e promover a integração da economia real. Essa escolha estratégica não apenas molda os diferentes caminhos das indústrias de IA nos dois países, mas também anuncia a aceleração do ecossistema global de IA de “competição de monopólio” para “aberto e ganha-ganha”.

Bom o Suficiente é Bom o Suficiente

O ecossistema de open source de IA da China não está apenas acelerando o desenvolvimento da industrialização de IA na China e no mundo, mas também colocando a crença dos Estados Unidos na tecnologia em uma armadilha estranha.

Diante da crescente pressão trazida pelo efeito DeepSeek, a Meta lançou o Llama4 em 5 de abril, alegando ser o modelo multimodal grande mais forte da história.

No entanto, após testes reais, este é um modelo decepcionante. O comprimento do contexto de 10 milhões de tokens geralmente dá errado, o teste inicial de bola é difícil de completar e o erro de tamanho de comparação 9.11 > 9.9 ocorre. Poucos dias após o lançamento do modelo, escândalos como renúncias de executivos e trapaças em testes também foram confirmados por funcionários internos.

Mais notícias provam que o Llama4 pode ser considerado um produto que Zuckerberg correu para colocar nas prateleiras. Então, a pergunta é, por que Zuckerberg teve que lançá-lo em abril?

Como mencionado anteriormente, a indústria de IA dos EUA tem uma crença confusa na tecnologia, acreditando que seus produtos devem ser os mais fortes e avançados, então eles iniciaram uma corrida armamentista. No entanto, o efeito marginal decrescente do treinamento de IA fez com que os grandes fabricantes consumissem enormes quantidades de custos e, não apenas o limite técnico não foi construído, mas eles caíram no atoleiro dos gargalos de poder de computação.

Depois que a OpenAI lançou a função de geração de imagem do GPT-4o, Altman twittou alguns dias depois que suas GPUs estavam “queimando”. Menos de uma semana após o lançamento do Gemini2.5, o chefe do GoogleAIStudio disse que ainda estavam atormentados por “limites de taxa” e os desenvolvedores só podiam enviar 20 solicitações por minuto. Parece que nenhuma empresa consegue lidar com as necessidades de inferência de modelos super grandes.

Na verdade, os Estados Unidos estão caindo em um mal-entendido. O responsável pelo Zhiyuan Research Institute disse: “Se um novo modelo usa 100 vezes o custo para obter um aumento de 10 pontos na pontuação de referência, então este novo modelo não tem sentido para mais de 80% dos cenários de aplicação porque não há custo-benefício.”

As empresas chinesas de modelos grandes estão acelerando o ecossistema open source. Eles parecem não estar mais competindo pelo primeiro lugar, mas, em vez disso, ganharam mais clientes, especialmente clientes industriais, com sua abordagem de “bom o suficiente”.

Comparado com os orçamentos de dezenas de milhões para clientes governamentais e empresariais, muitas empresas e instituições têm necessidades urgentes de IA, mas não têm tantas soluções existentes. Usar modelos open source para desenvolver suas próprias soluções quase se tornou sua única escolha:

  • A Baosteel usa o “modelo grande + modelo pequeno” para processos-chave de engenharia metalúrgica para alerta precoce inteligente de equipamentos de produção.
  • O “Coal Science Guardian Large Model ChinamjGPT” do China Coal Science and Industry Group reduz o tempo de inatividade do equipamento e os custos de manutenção em 30% e 20%,respectivamente.
  • A Shanghai Mengbo Intelligent Internet of Things Technology criou uma plataforma de aplicação de otimização de processo de detecção de ponta e forno de recozimento contínuo baseada em um modelo grande leve.
  • A Mifei Technology percebeu previsão, manutenção e gerenciamento inteligentes de sistemas automatizados de manuseio de materiais em fábricas de wafer de semicondutores com base na tecnologia de modelo grande.

Esses são todos os casos representativos de modelos open source sendo implementados em cenários industriais.

Além dos usos industriais, o ecossistema open source também pode ajudar em mais empreendimentos de bem-estar público.

O Shanshui Nature Conservation Center está comprometido com a proteção de leopardos-das-neves e ecossistemas de planalto. As câmeras infravermelhas que ele instala tiram um grande número de fotos ou vídeos a cada trimestre. É extremamente ineficiente e demorado depender da identificação manual de vestígios de leopardos-das-neves. A Huawei Ascend está cooperando com o Shanshui Nature Conservation Center para identificar vestígios de leopardos-das-neves. A Huawei abriu o código dos modelos e ferramentas relevantes para reconhecimento de espécies de imagem infravermelha em Sanjiangyuan, diminuindo o limite para participar do desenvolvimento de IA e permitindo que mais instituições de pesquisa e proteção que usam o modelo se beneficiem. As pessoas podem trabalhar juntas para otimizar o modelo em termos de conjuntos de dados, processamento de dados e limpeza de dados.

O Efeito “Bazaar” do Open Source

Eric Raymond, o porta-estandarte do movimento de software open source, propôs uma metáfora em seu livro de 1999 “The Cathedral and the Bazaar”: O modelo tradicional de desenvolvimento de software de código fechado é como construir uma catedral. O software é cuidadosamente projetado e construído por alguns especialistas (arquitetos) em um ambiente isolado e só é lançado para os usuários depois de finalmente concluído; O modelo de desenvolvimento open source é como um bazar movimentado, aparentemente caótico, mas vibrante. O desenvolvimento de software é aberto, descentralizado e evolutivo.

O livro acredita que para muitos tipos de projetos de software, especialmente software complexo de nível de sistema (como kernels de sistema operacional), o modelo de desenvolvimento “bazaar” aberto, colaborativo e descentralizado, embora possa parecer caótico, é na verdade mais eficiente, produz software de maior qualidade e mais robusto do que o modelo tradicional, fechado e centralizado de “catedral”. Ele pode descobrir e corrigir erros mais rápido e melhor absorver o feedback do usuário e as contribuições da comunidade por meio de mecanismos como “lançar cedo, lançar com frequência” e alavancar a revisão por pares em grande escala (“olhos suficientes”), promovendo assim a rápida iteração e inovação do software.

O enorme sucesso de projetos open source como o Linux verificou o ponto de Raymond.

O movimento open source trouxe aos Estados Unidos e ao mundo um enorme valor que excede em muito seu próprio investimento. Um relatório de pesquisa de 2024 da Universidade de Harvard afirmou: “O open source investiu US$ 4,15 bilhões e criou US$ 8,8 trilhões em valor para as empresas (ou seja, cada US$ 1 investido cria US$ 2.000 em valor). Sem o open source, os gastos corporativos com software seriam 3,5 vezes maiores do que são agora.”

Hoje, as empresas chinesas aprenderam isso. As empresas americanas de IA parecem ter esquecido.

Na verdade, para as empresas chinesas de modelos grandes, mesmo que não considerem os benefícios sociais, escolher abraçar o ecossistema open source não é não lucrativo para as próprias empresas.

Muitas empresas de modelos grandes disseram ao Observer.com que open source não significa abrir mão da comercialização. Open source ainda tem a lógica de lucro do open source. Comparado com se é open source ou não, como atender melhor os clientes tecnicamente é a questão-chave.

Tomando a Zhipu AI como um exemplo, ela afirma ser a única empresa na China que faz benchmark completo com a OpenAI, mas, comparada com a estratégia de código fechado da OpenAI, é uma das praticantes mais determinadas da estratégia open source na indústria.

A Zhipu assumiu a liderança na abertura do código do primeiro modelo grande de bate-papo da China, ChatGLM-6B, em 2023. Desde sua criação há quase seis anos, a Zhipu abriu o código de mais de 55 modelos, com um volume de download cumulativo de quase 40 milhões de vezes na comunidade internacional de open source.

A Zhipu disse ao Observer.com que a Zhipu espera que sua estratégia open source contribua para transformar Pequim em uma “capital global de open source” para inteligência artificial.

Especificamente, no nível comercial, a Zhipu optou por atrair um ecossistema de desenvolvedores por meio de open source e fornecer soluções personalizadas pagas para clientes B-end e G-end.

Além de vender soluções, vender APIs também é um importante elo de lucro.

Tomando a DeepSeek como um exemplo, o primeiro negócio do modelo open source é a venda de APIs de alto desempenho. Embora os serviços básicos sejam gratuitos, as empresas podem fornecer serviços de API de alto desempenho e cobrar com base no uso. O preço da API para DeepSeek-R1 é de 1 yuan por milhão de tokens de entrada e 16 yuans por milhão de tokens de saída. Se a cota de token gratuita for esgotada ou a API básica não atender às necessidades, os usuários tendem a usar a versão paga para manter a estabilidade dos processos de negócios.

Comparado com empresas que têm apenas serviços de modelo, a Alibaba escolheu outro modelo de monetização open source: agrupamento de ecossistemas.

A série Qwen da Alibaba, como uma pioneira de open source, atrai desenvolvedores para usar computação em nuvem e outras infraestruturas por meio de open source full-modal, formando um cenário de ciclo fechado. Seu modelo é apenas uma introdução no estágio inicial, e os produtos com preços marcados são, na verdade, serviços de nuvem.

A aplicação de globalização de modelos grandes chineses de open source mudou de “seguimento de tecnologia” para “domínio do ecossistema”. Quando os Estados Unidos estão presos no dilema de “monopólio de código fechado” e “open source fora de controle”, a China está reconstruindo a lógica subjacente do ecossistema global de open source de IA por meio de “inovação de contrato + cultivo de cenário”. O campo de batalha final deste jogo não está na competição de escala de parâmetros, mas no mercado de trilhões de dólares de integração profunda da tecnologia de IA e da economia real.