Ernie 4.5: Uma Potência Multimodal
A Baidu, um dos principais players no cenário tecnológico da China, introduziu um par de novos modelos de inteligência artificial (IA). A empresa afirma ousadamente que essas novas ofertas superam as de concorrentes como DeepSeek e OpenAI em avaliações de benchmark específicas. Este desenvolvimento intensifica ainda mais a competição em curso no campo em rápida evolução dos modelos de linguagem grande (LLMs). Num domingo recente, a Baidu lançou publicamente seu mais recente modelo fundamental multimodal, o Ernie 4.5, e seu modelo inaugural de raciocínio multimodal, o Ernie X1, tornando-os acessíveis em seu website.
Ernie 4.5, com suas amplas capacidades multimodais abrangendo imagens, áudio e vídeo, demonstrou desempenho superior em comparação com o GPT-4o da OpenAI. Essa superação foi observada em uma variedade de plataformas de benchmark, incluindo os notáveis CCBench e OCRBench, conforme detalhado em um comunicado divulgado pela Baidu na plataforma WeChat. Além disso, a empresa afirma que as capacidades de processamento de texto do modelo fundamental Ernie 4.5 não apenas excedem as do DeepSeek V3, mas também atingem um nível de desempenho aproximadamente comparável ao do GPT-4.5 da OpenAI, com base em uma série de avaliações de benchmark.
O Papel Pioneiro da Baidu e a Ascensão da Competição
A Baidu detém a distinção de ser a primeira grande empresa de tecnologia chinesa a introduzir um LLM na China. Este movimento pioneiro ocorreu em março de 2023, surfando na onda de entusiasmo gerada pelo lançamento do ChatGPT da OpenAI. No entanto, a vantagem inicial da Baidu tem sido cada vez mais contestada por outros players emergentes de IA na China nos últimos dois anos. A recente manobra estratégica da gigante das buscas para reforçar sua posição no mercado de IA da China ocorre em um momento em que a DeepSeek desencadeou uma tendência de código aberto. Simultaneamente, gigantes da indústria como Alibaba, Tencent e ByteDance estão buscando agressivamente usuários corporativos e consumidores para seus respectivos modelos de IA.
Ernie X1: Desempenho e Preços
Embora a Baidu não tenha divulgado resultados específicos de benchmark para seu recém-introduzido modelo de raciocínio, Ernie X1, a empresa afirmou que ele “oferece desempenho no mesmo nível do DeepSeek R1 pela metade do preço”. Esta declaração sugere uma vantagem competitiva significativa em termos de custo-benefício.
Para empresas que buscam integrar as capacidades do Ernie X1, o preço para acesso à sua interface de programação de aplicativos (API) é estruturado da seguinte forma: 2 yuans (aproximadamente US$ 0,28) por milhão de tokens de entrada e 8 yuans por milhão de tokens de saída. Em contraste, a DeepSeek atualmente cobra US$ 0,55 por milhão de tokens de entrada e US$ 2,19 por milhão de tokens de saída para seu DeepSeek-reasoner, que é impulsionado por seu modelo de raciocínio R1. Vale a pena notar que a DeepSeek, uma start-up com sede em Hangzhou, implementou recentemente um aumento em seus preços de API em resposta a um aumento substancial na demanda.
A Mudança da Baidu para o Código Aberto
Robin Li Yanhong, fundador, presidente e CEO da Baidu, fez um anúncio notável no mês passado sobre o futuro do Ernie 4.5. Ele revelou que o modelo se tornaria de código aberto a partir de 30 de junho. Essa decisão representa um afastamento significativo de seu apoio anteriormente firme ao desenvolvimento de IA de código fechado, marcando uma virada de 180 graus em sua abordagem.
Li elaborou sobre essa mudança estratégica durante uma teleconferência de resultados com analistas em fevereiro, afirmando: “Uma coisa que aprendemos com a DeepSeek é que tornar os melhores modelos de código aberto pode ajudar muito na adoção”. Ele explicou ainda: “Quando o modelo é de código aberto, as pessoas naturalmente querem experimentá-lo por curiosidade, o que ajuda a impulsionar uma adoção mais ampla”. Este reconhecimento dos benefícios do desenvolvimento de código aberto ressalta a estratégia em evolução da Baidu no competitivo cenário da IA.
O Desempenho de Negócios da Baidu em Meio aos Avanços da IA
Apesar do progresso notável que a Baidu fez no campo da inteligência artificial, os negócios gerais da empresa estão enfrentando dificuldades devido à receita de publicidade mais fraca. Relatórios financeiros recentes indicam que a receita total da Baidu no quarto trimestre experimentou um declínio anual de 2%. Além disso, a receita do ano inteiro também viu uma diminuição de 1%. Esses números destacam os desafios que a Baidu enfrenta ao equilibrar seus investimentos em tecnologia de IA de ponta com a necessidade de manter um forte desempenho financeiro.
Expandindo os Aspectos Chave
Para fornecer uma compreensão mais abrangente, vamos nos aprofundar em alguns dos aspectos críticos do anúncio da Baidu e no contexto mais amplo do cenário de IA na China.
O Significado da Multimodalidade:
A ênfase nas capacidades “multimodais” tanto no Ernie 4.5 quanto no Ernie X1 é crucial. Os LLMs tradicionais se concentravam principalmente no processamento baseado em texto. No entanto, a capacidade de processar e entender informações de várias modalidades – imagens, áudio e vídeo – abre uma vasta gama de novas possibilidades. Isso inclui:
- Reconhecimento de Imagem Aprimorado: Os modelos de IA agora podem não apenas identificar objetos em imagens, mas também entender o contexto e os relacionamentos entre eles.
- Transcrição e Análise de Áudio Melhoradas: Transcrever a linguagem falada com maior precisão e até mesmo detectar nuances como emoção e intenção em gravações de áudio.
- Compreensão de Vídeo: Analisar o conteúdo de vídeo para identificar cenas, ações e até mesmo prever eventos futuros.
O Debate do Código Aberto:
A decisão de Robin Li de tornar o Ernie 4.5 de código aberto é um desenvolvimento significativo no debate em andamento entre o desenvolvimento de IA de código fechado e de código aberto.
- Código Fechado: Os proponentes dessa abordagem argumentam que ela permite um melhor controle sobre a tecnologia, garantindo seu uso responsável e prevenindo o uso indevido. Também permite que as empresas protejam sua propriedade intelectual e mantenham uma vantagem competitiva.
- Código Aberto: Os defensores do desenvolvimento de código aberto acreditam que ele promove a colaboração, acelera a inovação e promove a transparência. Ele permite que pesquisadores e desenvolvedores em todo o mundo contribuam para o avanço da tecnologia de IA.
A mudança da Baidu para o código aberto, pelo menos para o Ernie 4.5, sugere um reconhecimento do crescente impulso do movimento de código aberto e seus potenciais benefícios.
O Cenário Competitivo:
A corrida de IA na China é intensa, com inúmeras empresas disputando o domínio.
- Alibaba: O LLM Tongyi Qianwen da Alibaba é um grande concorrente, e a empresa está integrando ativamente a IA em suas várias unidades de negócios, incluindo comércio eletrônico, computação em nuvem e logística.
- Tencent: O LLM Hunyuan da Tencent é outro player significativo, e a empresa está aproveitando a IA para aprimorar suas plataformas de mídia social, ofertas de jogos e serviços em nuvem.
- ByteDance: A empresa-mãe do TikTok, ByteDance, também está investindo pesadamente em IA, utilizando-a para impulsionar seus algoritmos de recomendação e desenvolver novos produtos.
- DeepSeek: A DeepSeek é uma concorrente formidável no espaço LLM.
O Impacto do Preço:
A estratégia de preços agressiva da Baidu para o Ernie X1, reduzindo o preço da DeepSeek pela metade, é uma indicação clara de sua intenção de ganhar participação de mercado. Essa guerra de preços pode potencialmente beneficiar empresas e consumidores, tornando a tecnologia de IA mais acessível.
As Implicações Mais Amplas:
Os avanços da Baidu em IA, juntamente com a intensa competição no mercado chinês, têm implicações de longo alcance:
- Avanço Tecnológico: O ritmo acelerado da inovação está impulsionando o desenvolvimento de modelos de IA cada vez mais sofisticados com capacidades mais amplas.
- Impacto Econômico: A IA está pronta para transformar várias indústrias, aumentando a produtividade, criando novos empregos e potencialmente remodelando o cenário econômico global.
- Impacto Social: A adoção generalizada da IA levanta importantes questões éticas e sociais que precisam ser abordadas, incluindo questões relacionadas a viés, privacidade e deslocamento de empregos.
Mais Detalhes sobre a Estratégia da Baidu
A estratégia da Baidu parece ser multifacetada, abrangendo tanto a inovação tecnológica quanto o posicionamento de mercado.
1. Proeza Tecnológica:
- Foco na Multimodalidade: A Baidu está claramente priorizando o desenvolvimento de modelos de IA multimodais, reconhecendo o potencial dessa tecnologia para desbloquear novas aplicações e capacidades.
- Melhoria Contínua: O lançamento do Ernie 4.5 e do Ernie X1 demonstra o compromisso da Baidu com a pesquisa e o desenvolvimento contínuos, constantemente ultrapassando os limites do desempenho da IA.
- Adoção do Código Aberto: A decisão de tornar o Ernie 4.5 de código aberto sinaliza uma disposição de se envolver com a comunidade de IA mais ampla e contribuir para o avanço coletivo do campo.
2. Posicionamento de Mercado:
- Preços Competitivos: O preço agressivo do Ernie X1 é um movimento estratégico para atrair usuários e ganhar participação de mercado no cenário altamente competitivo de LLM.
- Foco em Empresas: O foco no acesso à API sugere que a Baidu está ativamente mirando empresas que buscam integrar a IA em suas operações.
- Abordando Fraquezas: A empresa está reconhecendo e abordando seus desafios, como o declínio na receita de publicidade, aproveitando seus avanços em IA para diversificar suas ofertas e explorar novas fontes de receita.
3. Visão de Longo Prazo:
- Liderança em IA: As ações da Baidu sugerem uma ambição clara de se tornar um líder no cenário global de IA, não apenas na China.
- Tecnologia Transformativa: A empresa parece ver a IA como uma tecnologia transformadora com o potencial de remodelar seus negócios e contribuir para um progresso social mais amplo.
- Adaptabilidade: A disposição da Baidu em adaptar sua estratégia, como evidenciado pela mudança para o desenvolvimento de código aberto, demonstra sua agilidade e capacidade de resposta às dinâmicas em evolução da indústria de IA.
Em essência, a Baidu está se posicionando como uma força importante na revolução da IA, combinando inovação tecnológica com manobras estratégicas de mercado para atingir seus objetivos ambiciosos. O progresso da empresa e a competição em andamento no mercado chinês de IA serão observados de perto, pois têm implicações significativas para o futuro da IA globalmente.