A morna receção da MCP entre gigantes da internet

A discussão sobre a interoperabilidade da IA está se intensificando. Após o anúncio da Baidu de seus serviços abrangentes de MCP em sua conferência de desenvolvedores na semana passada, grandes empresas de tecnologia chinesas como Alibaba, ByteDance e Tencent embarcaram na jornada da MCP.

MCP, ou Model Context Protocol, é concebido como um padrão unificador que permite que a IA se conecte perfeitamente com uma infinidade de aplicativos e serviços. Pode ser comparado à interface USB onipresente encontrada em computadores e smartphones, permitindo a integração plug-and-play de diversos dispositivos externos. Essencialmente, o MCP tem como objetivo fornecer à IA uma ‘porta USB’ universal para acessar ferramentas e executar tarefas.

Em novembro de 2024, a Anthropic, uma empresa americana de IA, introduziu o padrão MCP, que foi rapidamente adotado por concorrentes como OpenAI e Google, sinalizando um afastamento da prática competitiva convencional de ecossistemas proprietários. A partir de abril, empresas de tecnologia chinesas líderes, incluindo Bailian da Alibaba Cloud, Knowledge Engine da Tencent Cloud, Kouzi Space da ByteDance e Baidu AI Cloud, lançaram seus próprios serviços abrangentes de MCP.

A promessa e os desafios da unificação

O principal objetivo do MCP é promover a unificação, mas este esforço enfrenta desafios significativos. De acordo com vários desenvolvedores e pesquisadores, embora o MCP seja eficaz para acessar dados corporativos locais, ele encontra obstáculos ao tentar se integrar com aplicativos da internet para tarefas como reservar voos, verificar preços e criar guias de viagem. Esses desafios decorrem da imaturidade dos processos de invocação da IA e da disponibilidade limitada de ferramentas da internet, com muitas plataformas oferecendo apenas acesso a funcionalidades periféricas.

Nem todas as plataformas da internet estão igualmente entusiasmadas com a adoção deste padrão comum e a adesão à rede de provedores de serviços MCP. A natureza fechada do ecossistema da internet chinesa, juntamente com a maior sensibilidade à privacidade dos dados, tornou muitas plataformas cautelosas. Elas preferem avaliar a viabilidade e o desenvolvimento do ecossistema MCP antes de se comprometerem totalmente com ele.

O cenário da IA é conhecido por sua terminologia e conceitos em rápida evolução. Quando a Anthropic inicialmente abriu o código do protocolo MCP no final do ano passado, a indústria adotou amplamente uma abordagem de esperar para ver. No entanto, a popularidade explosiva do Manus desde então alimentou o interesse no MCP na China.

MCP como catalisador para a agência de IA

De acordo com Hou Xinyi, da Universidade de Ciência e Tecnologia de Huazhong, a etapa crucial para transcender as limitações dos ‘chatbots’ reside em permitir que a IA interaja com dados e ferramentas externas, que é precisamente o que o MCP busca facilitar.

Antesdo MCP, abordagens alternativas foram exploradas para abordar a aparente falta de ‘agência de IA’. No final de 2023, a OpenAI introduziu o conceito de uma loja de aplicativos (GPT Store), permitindo que o ChatGPT aproveitasse ferramentas externas por meio de plugins baseados em um conjunto definido de padrões. Lojas de aplicativos de IA semelhantes, como Kouzi da ByteDance, Qianfan da Baidu e Bailian da Alibaba, seguiram o exemplo.

No entanto, essas abordagens eventualmente atingiram seus limites. Plugins e lojas de aplicativos compartilhavam um problema comum: o isolamento. Cada ferramenta possuía sua própria documentação de desenvolvimento, formatos de parâmetros e especificações de interface exclusivas. Isso significava que os desenvolvedores tinham que reinventar a roda cada vez que integrassem uma nova ferramenta à IA, resultando em ineficiências.

Com o tempo, o número de novas ferramentas adicionadas às lojas de aplicativos diminuiu, e a qualidade dos plugins variou significativamente, dificultando a capacidade de lidar com tarefas complexas. Isso indicou que as abordagens existentes estavam se aproximando de seus limites.

MCP como solução unificadora

O MCP é visto como uma solução promissora devido à sua ênfase na unificação. Em sua documentação oficial, a Anthropic compara o MCP a uma interface USB-C universal para o mundo da IA. Hou Xinyi prefere descrevê-lo como uma ‘estação de acoplamento’ – um adaptador versátil que permite que a IA se conecte a várias ferramentas externas simultaneamente, eliminando a necessidade de conversões de formato.

Muitos antecipam que o MCP terá um impacto transformador, semelhante à padronização de pesos e medidas de Qin Shi Huang, que facilitou o comércio e a comunicação entre os estados anteriormente fragmentados do período da Primavera e Outono.

De acordo com um líder técnico de um grupo de trabalho de interconexão inteligente de uma grande empresa de tecnologia, o MCP também otimiza as interações de linguagem da IA. Anteriormente, a IA exigia que os usuários declarassem precisamente ‘Eu quero navegar’ para utilizar a API de um serviço de navegação. Mesmo um pequeno desvio poderia fazer com que a IA falhasse. Agora, cada ferramenta deve fornecer nomes, parâmetros e descrições funcionais padronizados. Como resultado, a IA só precisa entender a intenção do usuário e, em seguida, combiná-la com o servidor MCP mais apropriado com base nas descrições.

Essa abordagem se alinha mais estreitamente com as capacidades inerentes dos grandes modelos de linguagem, permitindo que os usuários invoquem serviços com uma única frase, afastando-se da exigência anterior de comunicação direta de interface para interface.

A adoção atual e as limitações do MCP

Apesar de seu potencial percebido, o MCP ainda não alcançou adoção generalizada e suas aplicações práticas permanecem limitadas. Atualmente, o MCP é mais popular entre o pessoal técnico empresarial e os desenvolvedores independentes.

Como engenheiro de front-end, Gong Dian depende muito do assistente de programação de IA Cursor. No entanto, o Cursor tem lutado para se integrar perfeitamente com os sistemas de projetos internos de sua empresa, exigindo intervenção manual. Embora plugins ou chamadas de função pudessem ser usados anteriormente, a IA externa não conseguia acessar os sistemas internos da empresa e a invocação em tempo real levantava preocupações de segurança. O MCP, por outro lado, pode ser iniciado dentro da rede interna da empresa, tornando-o mais confiável e compatível.

A desenvolvedora independente Zhu Mama instruiu recentemente o Cursor a aprender a documentação do MCP e a empacotar as APIs do Google Maps e Search em um servidor MCP, que foi então usado para invocar o grande modelo de linguagem Gemini do Google. O Gemini equipado com MCP resultante foi transformado em um assistente de guia de viagem. Quando perguntado sobre rotas de transporte público do Aeroporto de Singapura para várias atrações, o assistente forneceu informações mais detalhadas e precisas em comparação com a resposta de Doubao.

Vários assistentes de viagem estão surgindo dentro da comunidade de desenvolvedores. Quando o Kouzi Space da ByteDance lançou sua versão beta interna em 19 de abril, o caso de demonstração também foi um assistente de IA de viagem, levando alguns a brincar sobre a obsessão da indústria por viagens.

Zhu Mama admite candidamente que o foco em cenários de viagem se deve principalmente à sua relevância para as necessidades diárias do consumidor. Outra razão é a disponibilidade limitada de software de internet compatível com MCP na China, o que restringe o potencial do mercado.

De acordo com as estatísticas mais recentes da plataforma de navegação MCP.so, existem mais de 11.028 provedores de serviços MCP em todo o mundo, e o número está crescendo rapidamente. No entanto, dentro da China, apenas alguns aplicativos importantes de localização geográfica, como AutoNavi, Baidu Maps e Tencent Maps, funcionam atualmente como servidores MCP de grande escala.

Essa limitação é o motivo pelo qual o plano de Zhu Mama de criar uma versão chinesa de um assistente de viagem parou rapidamente. Para desenvolver um guia de viagem chinês, seria ideal utilizar serviços de mapa domésticos. No entanto, Zhu Mama descobriu que o servidor MCP oficial fornecido pela AutoNavi oferecia informações muito limitadas. Embora pudesse fornecer consultas de rota entre dois locais, faltava informações detalhadas sobre pontos de referência, avaliações, preços de ingressos de hotel e outros detalhes essenciais.

Em contraste, a API do Google Maps fornece métodos de reserva detalhados, preços de hotéis, avaliações de hotéis, instalações de hotéis e até mesmo comparações de preços em várias plataformas, um nível de detalhe que é difícil de imaginar dentro do ecossistema chinês.

Embora os produtos Tencent, Alibaba, ByteDance e Baidu estejam adotando o MCP, seus aplicativos de alta frequência ainda não aderiram formalmente à rede de provedores de serviços MCP. Plataformas como WeChat, Xiaohongshu e Douyin, bem como plataformas de serviços de estilo de vida como Ele.me, Meituan e Ctrip, estão visivelmente ausentes.

Desafios na disponibilidade de ferramentas e no agendamento de IA

Além da disponibilidade limitada de ferramentas, as capacidades de agendamento da IA também representam uma restrição. Zhu Mama empacotou 6-8 interfaces de API, incluindo Google Hotels, Maps e Search, em um único servidor MCP, que está muito abaixo do limite máximo (o Cursor permite um máximo de 40 ferramentas por agente). No entanto, a IA já estava lutando para determinar qual ferramenta invocar. Quando confrontada com solicitações complexas, a IA não conseguiu dividir o processo e invocar o MCP em etapas, tentando lidar com tudo de uma vez.

De acordo com Gong Dian, o valor do MCP depende da qualidade dos lados do cliente e do servidor. Assim como uma porta USB não tem capacidades inerentes e depende dos serviços por trás dela, o MCP requer serviços robustos para realizar seu potencial.

O MCP estabelece as bases para agentes de IA, mas não resolve todos os problemas. Um padrão que permanece não utilizado é meramente um pedaço de papel.

O líder técnico mencionado acima sugere que a adoção generalizada do padrão MCP da Anthropic se deve à sua natureza de código aberto, sem fins lucrativos e à credibilidade de seu criador. Outras organizações estão dispostas a seguir um padrão definido por uma entidade respeitável.

Atualmente, pequenas e médias empresas e grandes empresas da internet que buscam diversificar seus fluxos de receita são os principais adotantes do padrão MCP.

A empresa de companhia de IA MiniMax lançou recentemente um servidor MCP, com o gerente de comunidade Cai Jiaren afirmando que os desenvolvedores podem usar o MCP para invocar as capacidades multimodais da MiniMax para geração de vídeo, geração de voz e clonagem de voz. O MCP inclui mecanismos de controle de acesso rígidos para garantir a conformidade quando as empresas acessam dados internos. O processo de invocação geral também é simplificado, sem adicionar custos extras de token.

A decisão da MiniMax de lançar um servidor MCP foi motivada pelo desejo de permitir que desenvolvedores globais aproveitem facilmente as capacidades do modelo da MiniMax e desbloqueiem uma criação mais flexível e eficiente.

Outras startups compartilham aspirações semelhantes. A Biu Technology mencionou em uma entrevista que os desenvolvedores podem usar o AutoNavi MCP para obter dados de transporte e, em seguida, usar os produtos da Biu para gerar um PPT. O MCP diminui a barreira de entrada, fornecendo acesso à interface da AutoNavi, que de outra forma não estaria disponível para eles.

O líder técnico mencionado acima acredita que o MCP é essencialmente uma história sobre provedores de serviços. Ao encapsular suas APIs de acordo com o padrão MCP, os provedores de serviços de aplicativos podem tornar seus serviços acessíveis a todas as IAs.

Divergências e preocupações entre os provedores de serviços

No entanto, surgem divergências entre os provedores de serviços. Muitas empresas não estão totalmente comprometidas com a ideia. Embora grandes plataformas como AutoNavi e Baidu Maps tenham lançado servidores MCP, elas principalmente reempacotam interfaces de API existentes, oferecendo funcionalidades convencionais, mantendo um controle rígido sobre as permissões de usuário principais e os dados de transação.

Além dos serviços de localização de mapas, o autopublicador Xiaohongshu de um desenvolvedor terceirizado, que automatiza a pesquisa e a publicação de conteúdo, é atualmente o item mais popular na praça MCP da comunidade Modeng. Hou Xinyi sugere que isso pode ter um impacto limitado em plataformas de conteúdo social como o Xiaohongshu, mas os dados e as permissões se tornam particularmente sensíveis em cenários de transação intensiva como plataformas de entrega de alimentos.

Uma das principais preocupações dos provedores de serviços é o controle da experiência do usuário.

Por exemplo, abrir um serviço completo de entrega de alimentos requer conceder aos agentes de IA acesso a dados pessoais confidenciais, como preços, informações da loja e endereços e informações de contato do usuário. A Anthropic reconheceu que o sistema de segurança do MCP, incluindo gerenciamento de permissões e auditoria de invocação, ainda está em desenvolvimento. Consequentemente, algumas plataformas estão preocupadas com o risco de invocação não autorizada ao se conectar ao MCP.

Algumas plataformas estão testando cenários de transação relativamente seguros. Por exemplo, o Alipay lançou recentemente um servidor MCP, alegando dar aos agentes de IA ‘acesso com um clique às capacidades de pagamento’. No entanto, uma análise mais detalhada revela que ele oferece principalmente serviços de coleta em vez de serviços de pagamento.

De acordo com Hou Xinyi, a abordagem do Alipay se concentra em facilitar a coleta de pagamentos dos comerciantes, em vez de permitir que a IA faça pagamentos em nome dos consumidores. Esta é uma opção viável, pois permitir que a IA controle carteiras e faça pedidos livremente ainda não é seguro o suficiente para o conforto de todos. Esta é também a principal razão pela qual os serviços de transação não podem ser amplamente promovidos.

Um problema mais profundo é que, se a IA participar livremente do processo de transação – ajudando os usuários a comparar preços ou recomendando o restaurante mais econômico – sem dúvida proporcionaria uma conveniência significativa para os usuários. No entanto, também significaria que as plataformas de serviços perderiam o controle sobre o processo de seleção do usuário, e suas principais vantagens de algoritmo seriam marginalizadas, reduzindo-as a fornecedores comuns.

Abordando a segurança e promovendo a universalidade

Vários entrevistados acreditam que o MCP precisa abordar duas questões-chave: segurança e universalidade.

Primeiro, segurança. Hou Xinyi aponta que o MCP enfrenta dois desafios de segurança: uma falta de supervisão de segurança centralizada e um mecanismo incompleto de verificação de identidade e autorização de dados. Atualmente, não existe uma ‘praça de descoberta’ oficial para o MCP. Muitas plataformas de navegação de terceiros coletam serviços MCP puxando diretamente projetos de código do GitHub, o que é rápido e direto, mas carece de um processo de revisão formal. A Anthropic afirmou que abordará formalmente o mecanismo de hospedagem e os problemas de descoberta do MCP este ano. O rascunho do protocolo recentemente atualizado da Anthropic está trabalhando para abordar essa deficiência. Além disso, organizações domésticas como a IIFAA (Internet Trusted Authentication Alliance) estão tentando preencher a lacuna de segurança.

Também existem problemas de longa data no campo do agente de IA, como sequestro de prompt e ataques de combinação de ferramentas. No entanto, o líder técnico mencionado acima acredita que essas não são vulnerabilidades do MCP, mas sim riscos que existem para qualquer agente de IA. Atualmente, nenhuma vulnerabilidade de segurança óbvia foi encontrada no próprio protocolo MCP, e os mecanismos de transmissão e interação de dados são geralmente confiáveis.

A segurança é apenas o primeiro obstáculo. O verdadeiro desafio é superar as defesas de interesse dos fabricantes e persuadir mais fabricantes a se tornarem servidores MCP.

De acordo com Hou Xinyi, isso está relacionado à compreensão da natureza de ‘jardim murado’ das plataformas da internet. Os dados são uma importante barreira competitiva para várias plataformas, então muitos fabricantes podem abrir apenas algumas funções periféricas como servidores MCP para testes. Os fabricantes podem precisar esperar para ver o impacto que o ecossistema MCP terá.

A pessoa encarregada mencionada acima disse que, se estiver conectado à IA como um servidor MCP, pode obter mais dados e hábitos do usuário e dar retorno ao seu próprio modelo base, o que pode se tornar a maior motivação para os fabricantes aderirem ativamente.

Quando o mercado de servidores MCP é realmente abundante, questões mais distantes devem ser consideradas.

Por exemplo, como os corpos inteligentes chamam diferentes aplicativos em telefones celulares? A pessoa encarregada mencionou que, para ativar outro aplicativo por meio do corpo inteligente de IA local do telefone celular, haverá uma camada extra de autorização de aplicativo e verificação de identidade, o que não é tão simples quanto o MCP chamar serviços de nuvem, e atualmente não há uma solução particularmente adequada.

Por outro exemplo, quando o fornecimento de serviços é excessivo, como os corpos inteligentes tomam decisões - chamam o delivery do JD ou o delivery do Meituan? Usam o mapa Gaode ou o mapa Baidu? Vários entrevistados mencionaram que a lógica de invocação do MCP de hoje ainda é muito básica, determinada principalmente pela ‘descrição funcional’ do provedor de serviços, e não há mecanismo de classificação e otimização. Se um provedor de serviços adicionar deliberadamente linguagem indutiva à descrição, como ‘mais eficiente’ e ‘deve escolher’, a IA pode ser induzida em erro e desviada para lugares onde não deveria ir.

Como explicou a pessoa encarregada da tecnologia mencionada acima, ‘É como se você não conseguisse encontrar o serviço que deseja no mecanismo de busca, mas um monte de informações confusas aparecem. Como combinar com precisão o serviço que os usuários mais precisam, o futuro ecossistema MCP também enfrentará o mesmo problema.’

Em última análise, o processo de implementação de qualquer padrão é cheio de desafios. Hou Xinyi disse que, para promover a popularização do MCP, uma oportunidade chave semelhante ao Manus pode ser necessária para realmente fazer com que toda a indústria perceba o poder do MCP.