El debate en torno a la interoperabilidad de la IA se está intensificando. Tras el anuncio de Baidu de sus servicios integrales MCP en su conferencia de desarrolladores la semana pasada, las principales empresas tecnológicas chinas como Alibaba, ByteDance y Tencent se han embarcado en el camino del MCP.
MCP, o Model Context Protocol (Protocolo de Contexto del Modelo), se concibe como un estándar unificador que permite a la IA interactuar sin problemas con una multitud de aplicaciones y servicios. Se puede comparar con la interfaz USB ubicua que se encuentra en ordenadores y smartphones, lo que permite la integración plug-and-play de diversos dispositivos externos. En esencia, MCP pretende proporcionar a la IA un “puerto USB” universal para acceder a herramientas y ejecutar tareas.
En noviembre de 2024, Anthropic, una empresa estadounidense de IA, introdujo el estándar MCP, que fue rápidamente adoptado por competidores como OpenAI y Google, lo que indica una desviación de la práctica competitiva convencional de los ecosistemas propietarios. A partir de abril, las principales empresas tecnológicas chinas, como Bailian de Alibaba Cloud, Knowledge Engine de Tencent Cloud, Kouzi Space de ByteDance y Baidu AI Cloud, lanzaron sus propios servicios integrales MCP.
La promesa y los desafíos de la unificación
El principal objetivo de MCP es fomentar la unificación, pero este empeño se enfrenta a importantes desafíos. Según múltiples desarrolladores e investigadores, si bien MCP es eficaz para acceder a los datos empresariales locales, encuentra obstáculos al intentar integrarse con aplicaciones de Internet para tareas como reservar vuelos, comprobar precios y crear guías de viaje. Estos desafíos se deben a la inmadurez de los procesos de invocación de la IA y a la limitada disponibilidad de herramientas de Internet, ya que muchas plataformas solo ofrecen acceso a funcionalidades periféricas.
No todas las plataformas de Internet se muestran igualmente entusiasmadas con la adopción de este estándar común y la adhesión a la red de proveedores de servicios MCP. La naturaleza cerrada del ecosistema chino de Internet, junto con una mayor sensibilidad a la privacidad de los datos, ha hecho que muchas plataformas sean cautelosas. Prefieren evaluar la viabilidad y el desarrollo del ecosistema MCP antes de comprometerse plenamente con él.
El panorama de la IA es conocido por su terminología y conceptos en rápida evolución. Cuando Anthropic abrió inicialmente el protocolo MCP a finales del año pasado, la industria adoptó en gran medida una postura de esperar y ver. Sin embargo, la explosiva popularidad de Manus ha impulsado desde entonces el interés por MCP en China.
MCP como catalizador para la agencia de la IA
Según Hou Xinyi, de la Universidad de Ciencia y Tecnología de Huazhong, el paso crucial para trascender las limitaciones de los “chatbots” reside en permitir que la IA interactúe con datos y herramientas externas, que es precisamente lo que MCP pretende facilitar.
Antes de MCP, se exploraron enfoques alternativos para abordar la percibida falta de “agencia de la IA”. A finales de 2023, OpenAI introdujo el concepto de una tienda de aplicaciones (GPT Store), que permite a ChatGPT aprovechar herramientas externas a través de plugins basados en un conjunto definido de estándares. Le siguieron tiendas de aplicaciones de IA similares, como Kouzi de ByteDance, Qianfan de Baidu y Bailian de Alibaba.
Sin embargo, estos enfoques acabaron alcanzando sus límites. Los plugins y las tiendas de aplicaciones compartían un problema común: el aislamiento. Cada herramienta poseía su propia documentación de desarrollo, formatos de parámetros y especificaciones de interfaz únicos. Esto significaba que los desarrolladores tenían que reinventar la rueda cada vez que integraban una nueva herramienta en la IA, lo que generaba ineficiencias.
Con el tiempo, el número de nuevas herramientas añadidas a las tiendas de aplicaciones disminuyó, y la calidad de los plugins varió significativamente, lo que dificultó la capacidad de abordar tareas complejas. Esto indicaba que los enfoques existentes se estaban acercando a sus límites.
MCP como solución unificadora
MCP se considera una solución prometedora debido a su énfasis en la unificación. En su documentación oficial, Anthropic compara MCP con una interfaz USB-C universal para el mundo de la IA. Hou Xinyi prefiere describirlo como una “estación de acoplamiento”, un adaptador versátil que permite a la IA conectarse a múltiples herramientas externas simultáneamente, eliminando la necesidad de conversiones de formato.
Muchos prevén que MCP tendrá un impacto transformador, similar a la estandarización de pesos y medidas de Qin Shi Huang, que facilitó el comercio y la comunicación entre los estados previamente fragmentados del período de Primavera y Otoño.
Según un responsable técnico del grupo de trabajo de interconexión inteligente de una importante empresa tecnológica, MCP también optimiza las interacciones lingüísticas de la IA. Anteriormente, la IA requería que los usuarios indicaran con precisión “Quiero navegar” para utilizar la API de un servicio de navegación. Incluso una ligera desviación podía provocar el fallo de la IA. Ahora, cada herramienta debe proporcionar nombres, parámetros y descripciones funcionales estandarizados. Como resultado, la IA solo necesita entender la intención del usuario y luego emparejarla con el servidor MCP más adecuado basándose en las descripciones.
Este enfoque se alinea más estrechamente con las capacidades inherentes de los grandes modelos lingüísticos, lo que permite a los usuarios invocar servicios con una sola frase, alejándose del requisito anterior de comunicación directa de interfaz a interfaz.
Adopción y limitaciones actuales de MCP
A pesar de su potencial percibido, MCP aún no ha logrado una adopción generalizada, y sus aplicaciones prácticas siguen siendo limitadas. Actualmente, MCP es más popular entre el personal técnico de las empresas y los desarrolladores independientes.
Como ingeniero de front-end, Gong Dian confía en gran medida en el asistente de programación de IA Cursor. Sin embargo, Cursor ha tenido dificultades para integrarse sin problemas con los sistemas de proyectos internos de su empresa, lo que requiere la intervención manual. Si bien antes se podían utilizar plugins o llamadas a funciones, la IA externa no podía acceder a los sistemas internos de la empresa, y la invocación en tiempo real planteaba problemas de seguridad. MCP, por otro lado, puede iniciarse dentro de la red interna de la empresa, lo que lo hace más fiable y compatible.
El desarrollador independiente Zhu Mama recientemente instruyó a Cursor para que aprendiera la documentación de MCP y empaquetara las API de Google Maps y Search en un servidor MCP, que luego se utilizó para invocar el gran modelo lingüístico Gemini de Google. El Gemini equipado con MCP resultante se transformó en un asistente de guía de viajes. Cuando se le preguntó sobre las rutas de transporte público desde el aeropuerto de Singapur a varias atracciones, el asistente proporcionó información más detallada y precisa en comparación con la respuesta de Doubao.
Están surgiendo varios asistentes de viaje dentro de la comunidad de desarrolladores. Cuando Kouzi Space de ByteDance lanzó su beta interna el 19 de abril, el caso de demostración también fue un asistente de IA de viajes, lo que llevó a algunos a bromear sobre la obsesión de la industria con los viajes.
Zhu Mama admite con franqueza que el enfoque en los escenarios de viaje se debe principalmente a su relevancia para las necesidades cotidianas de los consumidores. Otra razón es la limitada disponibilidad de software de Internet compatible con MCP en China, lo que restringe el potencial del mercado.
Según las últimas estadísticas de la plataforma de navegación MCP.so, hay más de 11.028 proveedores de servicios MCP en todo el mundo, y el número está creciendo rápidamente. Sin embargo, dentro de China, solo unas pocas aplicaciones importantes de ubicación geográfica, como AutoNavi, Baidu Maps y Tencent Maps, funcionan actualmente como servidores MCP a gran escala.
Esta limitación es la razón por la que el plan de Zhu Mama de crear una versión china de un asistente de viaje se estancó rápidamente. Para desarrollar una guía de viaje china, sería ideal utilizar los servicios de mapas nacionales. Sin embargo, Zhu Mama descubrió que el servidor MCP oficial proporcionado por AutoNavi ofrecía información muy limitada. Si bien podía proporcionar consultas de rutas entre dos ubicaciones, carecía de información detallada sobre puntos de referencia, reseñas, precios de billetes de hotel y otros detalles esenciales.
Por el contrario, la API de Google Maps proporciona métodos de reserva detallados, precios de hoteles, reseñas de hoteles, instalaciones de hoteles e incluso comparaciones de precios entre múltiples plataformas, un nivel de detalle que es difícil de imaginar dentro del ecosistema chino.
Si bien los productos de Tencent, Alibaba, ByteDance y Baidu están adoptando MCP, sus aplicaciones de alta frecuencia aún no se han unido formalmente a la red de proveedores de servicios MCP. Plataformas como WeChat, Xiaohongshu y Douyin, así como plataformas de servicios de estilo de vida como Ele.me, Meituan y Ctrip, están ausentes de forma conspicua.
Desafíos en la disponibilidad de herramientas y la programación de la IA
Además de la limitada disponibilidad de herramientas, las capacidades de programación de la IA también plantean una limitación. Zhu Mama empaquetó 6-8 interfaces API, incluidas Google Hotels, Maps y Search, en un solo servidor MCP, que está muy por debajo del límite máximo (Cursor permite un máximo de 40 herramientas por agente). Sin embargo, la IA ya estaba luchando por determinar qué herramienta invocar. Cuando se enfrentaba a solicitudes complejas, la IA no podía desglosar el proceso e invocar MCP por etapas, sino que intentaba manejarlo todo a la vez.
Según Gong Dian, el valor de MCP depende de la calidad tanto del lado del cliente como del servidor. Al igual que un puerto USB no tiene capacidades inherentes y depende de los servicios que hay detrás, MCP requiere servicios sólidos para hacer realidad su potencial.
MCP sienta las bases para los agentes de IA, pero no resuelve todos los problemas. Un estándar que permanece sin usar es simplemente un pedazo de papel.
El responsable técnico mencionado anteriormente sugiere que la adopción generalizada del estándar MCP de Anthropic se debe a su naturaleza de código abierto, sin ánimo de lucro y a la credibilidad de su creador. Otras organizaciones están dispuestas a seguir un estándar establecido por una entidad de buena reputación.
Actualmente, las pequeñas y medianas empresas y las grandes empresas de Internet que buscan diversificar sus fuentes de ingresos son los principales adoptantes del estándar MCP.
La empresa de acompañamiento de IA MiniMax lanzó recientemente un servidor MCP, y el gerente de la comunidad Cai Jiaren declaró que los desarrolladores pueden usar MCP para invocar las capacidades multimodales de MiniMax para la generación de vídeo, la generación de voz y la clonación de voz. El MCP incluye estrictos mecanismos de control de acceso para garantizar el cumplimiento cuando las empresas acceden a datos internos. El proceso de invocación general también se simplifica, sin añadir costes de token adicionales.
La decisión de MiniMax de lanzar un servidor MCP fue impulsada por el deseo de permitir a los desarrolladores globales aprovechar fácilmente las capacidades del modelo de MiniMax y desbloquear una creación más flexible y eficiente.
Otras startups comparten aspiraciones similares. Biu Technology mencionó en una entrevista que los desarrolladores pueden usar AutoNavi MCP para obtener datos de transporte y luego usar los productos de Biu para generar un PPT. MCP reduce la barrera de entrada al proporcionar acceso a la interfaz de AutoNavi, que de otro modo no estaría disponible para ellos.
El responsable técnico mencionado anteriormente cree que MCP es esencialmente una historia sobre proveedores de servicios. Al encapsular sus API de acuerdo con el estándar MCP, los proveedores de servicios de aplicaciones pueden hacer que sus servicios sean accesibles a toda la IA.
Divergencias y preocupaciones entre los proveedores de servicios
Sin embargo, surgen desacuerdos entre los proveedores de servicios. Muchas empresas no están totalmente comprometidas con la idea. Si bien las principales plataformas como AutoNavi y Baidu Maps han lanzado servidores MCP, principalmente reempaquetan las interfaces API existentes, ofreciendo funcionalidades convencionales mientras mantienen un estricto control sobre los permisos de usuario principales y los datos de transacción.
Además de los servicios de ubicación de mapas, el autopublicador de Xiaohongshu de un desarrollador externo, que automatiza la búsqueda y publicación de contenido, es actualmente el elemento más popular en la plaza MCP de la comunidad Modeng. Hou Xinyi sugiere que esto puede tener un impacto limitado en plataformas de contenido social como Xiaohongshu, pero los datos y los permisos se vuelven particularmente sensibles en escenarios de uso intensivo de transacciones como las plataformas de entrega de alimentos.
Una de las principales preocupaciones de los proveedores de servicios es el control de la experiencia del usuario.
Por ejemplo, abrir un servicio completo de entrega de alimentos requiere otorgar a los agentes de IA acceso a datos personales confidenciales, como precios, información de la tienda y direcciones y información de contacto del usuario. Anthropic ha reconocido que el sistema de seguridad de MCP, incluida la gestión de permisos y la auditoría de invocación, aún está en desarrollo. En consecuencia, algunas plataformas están preocupadas por el riesgo de invocación no autorizada al conectarse a MCP.
Algunas plataformas están probando escenarios de transacción relativamente seguros. Por ejemplo, Alipay lanzó recientemente un servidor MCP, alegando que da a los agentes de IA “acceso con un solo clic a las capacidades de pago”. Sin embargo, una mirada más de cerca revela que ofrece principalmente servicios de cobro en lugar de servicios de pago.
Según Hou Xinyi, el enfoque de Alipay se centra en facilitar el cobro de pagos de los comerciantes en lugar de permitir que la IA realice pagos en nombre de los consumidores. Esta es una opción viable, ya que permitir que la IA controle las billeteras y realice pedidos libremente aún no es lo suficientemente seguro para la comodidad de todos. Esta es también la razón clave por la que los servicios de transacción no se pueden promover ampliamente.
Un problema más profundo es que si la IA participa libremente en el proceso de transacción (ayudando a los usuarios a comparar precios o recomendando el restaurante más rentable), sin duda proporcionaría una comodidad significativa para los usuarios. Sin embargo, también significaría que las plataformas de servicios perderían el control sobre el proceso de selección del usuario, y sus ventajas de algoritmo principales se marginarían, reduciéndolas a proveedores ordinarios.
Abordar la seguridad y promover la universalidad
Varios entrevistados creen que MCP debe abordar dos cuestiones clave: la seguridad y la universalidad.
En primer lugar, la seguridad. Hou Xinyi señala que MCP se enfrenta a dos desafíos de seguridad: la falta de supervisión de seguridad centralizada y un mecanismo incompleto de verificación de identidad y autorización de datos. Actualmente, no existe una “plaza de descubrimiento” oficial para MCP. Muchas plataformas de navegación de terceros recopilan servicios MCP extrayendo directamente proyectos de código de GitHub, lo que es rápido y sencillo, pero carece de un proceso de revisión formal. Anthropic ha declarado que abordará formalmente el mecanismo de alojamiento de MCP y los problemas de capacidad de descubrimiento este año. El borrador de protocolo actualizado recientemente por Anthropic está trabajando para abordar esta deficiencia. Además, organizaciones nacionales como IIFAA (Internet Trusted Authentication Alliance) están intentando llenar la brecha de seguridad.
También hay problemas de larga data en el campo de los agentes de IA, como el secuestro de indicaciones y los ataques de combinación de herramientas. Sin embargo, el responsable técnico mencionado anteriormente cree que estas no son vulnerabilidades de MCP, sino riesgos que existen para cualquier agente de IA. Actualmente, no se han encontrado vulnerabilidades de seguridad obvias en el protocolo MCP en sí, y los mecanismos de transmisión e interacción de datos son generalmente fiables.
La seguridad es solo el primer obstáculo. El verdadero desafío es superar las defensas de intereses de los fabricantes y persuadir a más fabricantes para que se conviertan en servidores MCP.
Según Hou Xinyi, esto está relacionado con la comprensión de la naturaleza de “jardín amurallado” de las plataformas de Internet. Los datos son una importante barrera competitiva para varias plataformas, por lo que muchos fabricantes solo pueden abrir algunas funciones periféricas como servidores MCP para pruebas. Es posible que los fabricantes necesiten esperar y ver cuánto impacto tendrá el ecosistema MCP.
La persona a cargo mencionada anteriormente dijo que si está conectado a la IA como un servidor MCP, puede obtener más datos y hábitos del usuario, y devolverlos a su propio modelo base, lo que puede convertirse en la mayor motivación para que los fabricantes se unan activamente.
Cuando el mercado de servidores MCP sea realmente abundante, se deben considerar problemas más distantes.
Por ejemplo, ¿cómo llaman los cuerpos inteligentes a diferentes aplicaciones en los teléfonos móviles? La persona a cargo mencionó que para activar otra aplicación a través del cuerpo inteligente de IA local del teléfono móvil, habrá una capa adicional de autorización de la aplicación y verificación de identidad, que no es tan simple como que MCP llame a los servicios en la nube, y actualmente no existe una solución particularmente adecuada.
Por ejemplo, cuando la oferta de servicios es excesiva, ¿cómo toman decisiones los cuerpos inteligentes: pedir comida para llevar a JD o Meituan? ¿Usar el mapa de Gaode o el mapa de Baidu? Varios entrevistados mencionaron que la lógica de invocación de MCP de hoy en día sigue siendo muy básica, determinada principalmente por la “descripción funcional” del proveedor de servicios, y no existe un mecanismo de clasificación y optimización. Si un proveedor de servicios agrega deliberadamente lenguaje inductivo a la descripción, como “más eficiente” y “debe elegir”, la IA puede ser engañada y desviada a lugares donde no debería ir.
Como explicó la persona a cargo de la tecnología mencionada anteriormente: “Es como si no pudieras encontrar el servicio que deseas en el motor de búsqueda, sino que aparece un montón de información desordenada. Cómo hacer coincidir con precisión el servicio que los usuarios más necesitan, el futuro ecosistema MCP también enfrentará el mismo problema”.
En última instancia, el proceso de implementación de cualquier estándar está lleno de desafíos. Hou Xinyi dijo que para promover la popularización de MCP, se puede necesitar una oportunidad clave similar a Manus para hacer que toda la industria se dé cuenta verdaderamente del poder de MCP.