El Ascenso de Anthropic: Claude Líder

Claude 3.7 Sonnet: Un Nuevo Referente en la Destreza de Codificación

El reciente lanzamiento de Claude 3.7 Sonnet, hace apenas dos semanas, sirve como evidencia convincente. Esta última iteración ha destrozado los récords existentes en cuanto a rendimiento de codificación. Al mismo tiempo, Anthropic presentó Claude Code, un agente de IA de línea de comandos diseñado para acelerar el desarrollo de aplicaciones para programadores. Sumándose a este impulso, Cursor, un editor de código impulsado por IA que utiliza por defecto el modelo Claude de Anthropic, ha aumentado, según se informa, a la impresionante cifra de 100 millones de dólares en ingresos anuales recurrentes en tan solo 12 meses.

El énfasis deliberado de Anthropic en la codificación coincide con el creciente reconocimiento entre las empresas del potencial transformador de los agentes de codificación de IA. Estos agentes permiten tanto a los desarrolladores experimentados como a las personas sin experiencia en codificación crear aplicaciones con una velocidad y eficiencia sin precedentes. Como Guillermo Rauch, CEO de Vercel, una empresa en rápida expansión que permite a los desarrolladores (incluidos los no codificadores) desplegar aplicaciones front-end, declaró acertadamente: ‘Anthropic sigue estando a la cabeza’. La decisión de Vercel el año pasado de cambiar su principal modelo de codificación de GPT de OpenAI a Claude de Anthropic, tras una evaluación exhaustiva de su rendimiento en tareas de codificación cruciales, subraya este punto.

Claude 3.7 Sonnet, lanzado el 24 de febrero, ha tomado demostrablemente la delantera en casi todos los benchmarks de codificación. Logró un notable 70.3% en el altamente considerado benchmark SWE-bench, una medida de las capacidades de desarrollo de software de un agente. Esta puntuación supera significativamente a la de sus competidores más cercanos, o1 de OpenAI (48.9%) y DeepSeek-R1 (49.2%). Además, Claude 3.7 exhibe un rendimiento superior en tareas de agentes.

Estos resultados de los benchmarks han sido rápidamente validados por las comunidades de desarrolladores a través de pruebas en el mundo real. Las discusiones en línea, particularmente en plataformas como Reddit, que comparan Claude 3.7 con Grok 3 (el último modelo de xAI de Elon Musk), favorecen consistentemente el modelo de Anthropic para tareas de codificación. Un comentarista destacado resumió el sentimiento: ‘Basado en lo que he probado, Claude 3.7 parece ser el mejor para escribir código (al menos para mí)’. Es muy importante destacar que incluso Manus, el nuevo agente chino multipropósito que causó sensación a principios de esta semana, dijo que era mejor que Deep Research de Open AI y otras tareas autónomas, se construyó en gran medida sobre Claude.

Enfoque Estratégico: La Apuesta Empresarial de Anthropic

El enfoque inquebrantable de Anthropic en las capacidades de codificación está lejos de ser accidental. Las proyecciones filtradas reportadas por The Information sugieren que Anthropic apunta a la asombrosa cifra de 34.5 mil millones de dólares en ingresos para 2027. Esto representa un aumento de 86 veces con respecto a sus niveles actuales. Se espera que una parte sustancial (aproximadamente el 67%) de estos ingresos proyectados provenga del negocio de API, con las aplicaciones de codificación empresarial como el principal motor de crecimiento. Si bien Anthropic no ha revelado cifras de ingresos precisas, ha informado de un notable aumento del 1,000% en los ingresos por codificación durante el último trimestre de 2024. Sumándose a este impulso financiero, Anthropic anunció recientemente una ronda de financiación de 3.5 mil millones de dólares, valorando la empresa en la impresionante cifra de 61.5 mil millones de dólares.

Esta estrategia centrada en la codificación se alinea con los hallazgos del propio Índice Económico de Anthropic. El índice reveló que un significativo 37.2% de las consultas dirigidas a Claude entraban en la categoría ‘informática y matemática’. Estas consultas abarcaban principalmente tareas de ingeniería de software como la modificación de código, la depuración y la resolución de problemas de red.

El enfoque de Anthropic destaca en medio del panorama competitivo, donde los rivales a menudo se ven atrapados en un torbellino de actividad, intentando atender tanto a los mercados empresariales como a los de consumo con una amplia gama de características. OpenAI, si bien mantiene una fuerte ventaja debido a su temprano reconocimiento y adopción por parte de los consumidores, se enfrenta al desafío de servir tanto a los usuarios regulares como a las empresas con una diversa gama de modelos y funcionalidades. Google, de manera similar, está siguiendo una estrategia de ofrecer una amplia cartera de productos.

El enfoque comparativamente disciplinado de Anthropic también se refleja en sus decisiones de producto. En lugar de perseguir la cuota de mercado de los consumidores, la empresa ha priorizado las características de nivel empresarial, como la integración con GitHub, los registros de auditoría, los permisos personalizables y los controles de seguridad específicos del dominio. Seis meses antes, introdujo una enorme ventana de contexto de 500,000 tokens para los desarrolladores, un marcado contraste con la decisión de Google de limitar su ventana de 1 millón de tokens a los probadores privados. Este enfoque estratégico ha dado como resultado una oferta completa y centrada en la codificación que resuena cada vez más con las empresas.

La reciente introducción por parte de la empresa de características que permiten a los no codificadores publicar aplicaciones generadas por IA dentro de sus organizaciones, junto con la actualización de la consola de la semana pasada con capacidades de colaboración mejoradas (incluidas las indicaciones y plantillas compartibles), ejemplifica aún más esta tendencia. Esta democratización refleja una estrategia de ‘Caballo de Troya’: inicialmente empoderar a los desarrolladores para construir bases sólidas, seguido de la expansión del acceso a la fuerza laboral empresarial más amplia, llegando finalmente a la suite corporativa.

Experiencia Práctica con Claude: Un Experimento Práctico

Para evaluar las capacidades del mundo real de estos agentes de codificación, se llevó a cabo un experimento práctico, centrado en la construcción de una base de datos para almacenar artículos. Se emplearon tres enfoques distintos: Claude 3.7 Sonnet a través de la aplicación de Anthropic, el agente de codificación de Cursor y Claude Code.

Utilizando Claude 3.7 directamente a través de la aplicación de Anthropic, la orientación proporcionada fue notablemente perspicaz, particularmente para alguien sin amplia experiencia en codificación. El modelo presentó varias opciones, que van desde soluciones robustas que emplean bases de datos PostgreSQL hasta alternativas más ligeras como Airtable. Optando por la solución ligera, Claude guio metódicamente el proceso de extracción de artículos de una API e integración en Airtable utilizando un servicio de conector. Si bien el proceso tomó aproximadamente dos horas, principalmente debido a los desafíos de autenticación, culminó en un sistema funcional. Esencialmente, en lugar de escribir todo el código de forma autónoma, Claude proporcionó un plan integral para lograr el resultado deseado.

Cursor, con su dependencia predeterminada de los modelos de Claude, presentó una experiencia de editor de código completa y exhibió una mayor inclinación hacia la automatización. Sin embargo, requería permiso en cada paso, lo que resultaba en un flujo de trabajo algo iterativo.

Claude Code ofreció un enfoque diferente, operando directamente dentro del terminal y utilizando SQLite para crear una base de datos local poblada con artículos de un feed RSS. Esta solución demostró ser más simple y confiable para lograr el objetivo final, aunque menos robusta y con menos funciones en comparación con la implementación de Airtable. Esto destaca las compensaciones inherentes involucradas y subraya la importancia de seleccionar un agente de codificación en función de los requisitos específicos del proyecto.

La conclusión clave de este experimento es que, incluso como no desarrollador, fue posible construir aplicaciones de bases de datos funcionales utilizando los tres enfoques. Esto habría sido virtualmente inimaginable hace apenas un año. Y, notablemente, los tres enfoques se basaron en las capacidades subyacentes de Claude.

El Ecosistema de Agentes de Codificación: Cursor y Más Allá

Quizás el indicador más convincente del éxito de Anthropic es el crecimiento fenomenal de Cursor, un editor de código de IA. Los informes indican que Cursor ha acumulado 360,000 usuarios, con más de 40,000 de ellos siendo clientes de pago, en tan solo 12 meses. Esta rápida trayectoria de crecimiento posiciona potencialmente a Cursor como la empresa SaaS más rápida en alcanzar ese hito.

El éxito de Cursor está intrínsecamente ligado a Claude. Como observó Sam Witteveen, cofundador de Red Dragon (un desarrollador independiente de agentes de IA), ‘Tienes que pensar que su cliente número uno es Cursor. La mayoría de la gente en [Cursor] ya estaba usando el modelo Claude Sonnet, los modelos 3.5. Y ahora parece que todo el mundo está migrando a 3.7’.

La relación entre Anthropic y su ecosistema se extiende más allá de las empresas individuales como Cursor. En noviembre, Anthropic presentó su Protocolo de Contexto de Modelo (MCP) como un estándar abierto, lo que permite a los desarrolladores construir herramientas que interactúan sin problemas con los modelos de Claude. Este estándar ha ganado una amplia adopción dentro de la comunidad de desarrolladores.

Witteveen explicó la importancia de este enfoque: ‘Al lanzar esto como un protocolo abierto, están diciendo algo así como: ‘Oigan, todos, adelante. Pueden desarrollar lo que quieran que se ajuste a este protocolo. Vamos a apoyar este protocolo’’.

Esta estrategia crea un ciclo virtuoso: los desarrolladores construyen herramientas específicamente para Claude, mejorando su propuesta de valor para las empresas, lo que a su vez impulsa una mayor adopción y atrae a más desarrolladores.

El Panorama Competitivo: Microsoft, OpenAI, Google y el Código Abierto

Si bien Anthropic se ha labrado un nicho con su enfoque centrado, los competidores están siguiendo diversas estrategias con diferentes grados de éxito.

Microsoft mantiene una fuerte presencia a través de su GitHub Copilot, con 1.3 millones de usuarios de pago y la adopción por parte de más de 77,000 organizaciones en aproximadamente dos años. Empresas destacadas como Honeywell, State Street, TD Bank Group y Levi’s se encuentran entre sus usuarios. Esta amplia adopción se atribuye en gran medida a las relaciones empresariales existentes de Microsoft y a su ventaja de ser el primero en actuar, derivada de su temprana inversión en OpenAI y la utilización de los modelos de OpenAI para impulsar Copilot.

Sin embargo, incluso Microsoft ha reconocido las fortalezas de Anthropic. En octubre, permitió a los usuarios de GitHub Copilot seleccionar los modelos de Anthropic como una alternativa a las ofertas de OpenAI. Además, los modelos recientes de OpenAI, o1 y el más nuevo o3 (que enfatizan el razonamiento a través del pensamiento extendido), no han demostrado ventajas particulares en la codificación o las tareas de agentes.

Google ha hecho su propio movimiento ofreciendo recientemente su Code Assist de forma gratuita, pero esto parece ser más una maniobra defensiva que una iniciativa estratégica.

El movimiento de código abierto representa otra fuerza significativa en este panorama. Los modelos Llama de Meta han ganado una considerable tracción empresarial, con grandes empresas como AT&T, DoorDash y Goldman Sachs desplegando modelos basados en Llama para diversas aplicaciones. El enfoque de código abierto proporciona a las empresas un mayor control, opciones de personalización y beneficios de costos que los modelos cerrados a menudo no pueden igualar.

En lugar de ver esto como una amenaza directa, Anthropic parece estar posicionándose como complementario al código abierto. Los clientes empresariales pueden aprovechar Claude junto con los modelos de código abierto dependiendo de sus requisitos específicos, adoptando un enfoque híbrido que maximiza las fortalezas de cada uno.

De hecho, muchas empresas empresariales a gran escala han adoptado un enfoque multimodal, utilizando el modelo que mejor se adapte a una tarea determinada. Intuit, por ejemplo, inicialmente confió en OpenAI como el valor predeterminado para sus aplicaciones de declaración de impuestos, pero posteriormente cambió a Claude debido a su rendimiento superior en ciertos escenarios. Esta experiencia llevó a Intuit a desarrollar un marco de orquestación de IA que facilitó el cambio sin problemas entre modelos.

La mayoría de las otras empresas empresariales han adoptado desde entonces una práctica similar, empleando el modelo más apropiado para cada caso de uso específico, a menudo integrando modelos a través de simples llamadas API. Si bien un modelo de código abierto como Llama podría ser adecuado en algunos casos, Claude es a menudo la opción preferida para tareas que requieren alta precisión, como los cálculos.

Implicaciones Empresariales: Navegando el Cambio a los Agentes de Codificación

Para los responsables de la toma de decisiones empresariales, este panorama en rápida evolución presenta tanto oportunidades como desafíos.

La seguridad sigue siendo una preocupación primordial, pero un informe independiente reciente identificó a Claude 3.7 Sonnet como el modelo más seguro hasta la fecha, siendo el único probado que demostró ser ‘a prueba de jailbreak’. Esta postura de seguridad, combinada con el respaldo de Anthropic tanto de Google como de Amazon (y la integración en AWS Bedrock), lo posiciona favorablemente para la adopción empresarial.

La proliferación de agentes de codificación no solo está transformando la forma en que se desarrollan las aplicaciones; está democratizando el proceso. Según GitHub, un sustancial 92% de los desarrolladores con sede en EE. UU. en empresas empresariales ya estaban utilizando herramientas de codificación impulsadas por IA en el trabajo hace 18 meses. Es probable que esta cifra haya aumentado significativamente desde entonces.

Witteveen destacó la reducción de la brecha entre los miembros del equipo técnico y no técnico: ‘El desafío que la gente está teniendo [debido a] no ser un codificador es realmente que no conocen mucha de la terminología. No conocen las mejores prácticas’. Los agentes de codificación de IA están abordando cada vez más este desafío, lo que permite una colaboración más eficaz.

Para la adopción empresarial, Witteveen aboga por un enfoque equilibrado: ‘Es el equilibrio entre la seguridad y la experimentación en este momento. Claramente, en el lado del desarrollador, la gente está empezando a construir aplicaciones del mundo real con estas cosas’.

La aparición de agentes de codificación de IA significa un cambio fundamental en el desarrollo de software empresarial. Cuando se implementan de manera efectiva, estas herramientas no reemplazan a los desarrolladores, sino que transforman sus roles, permitiéndoles concentrarse en la arquitectura y la innovación en lugar de los detalles de implementación.

El enfoque disciplinado de Anthropic, centrándose específicamente en las capacidades de codificación mientras que los competidores persiguen múltiples prioridades, parece estar generando ventajas significativas. Para fines de 2025, este período puede ser visto retrospectivamente como el momento crucial en que los agentes de codificación de IA se convirtieron en herramientas empresariales indispensables, con Claude liderando la carga.

Para los responsables de la toma de decisiones técnicas, el imperativo es claro: iniciar la experimentación con estas herramientas con prontitud o arriesgarse a quedarse atrás de los competidores que ya las están aprovechando para acelerar drásticamente los ciclos de desarrollo. Esta situación refleja los primeros días de la revolución del iPhone, donde las empresas inicialmente intentaron restringir los dispositivos ‘no autorizados’ de sus redes corporativas, solo para eventualmente adoptar políticas BYOD a medida que la demanda de los empleados se volvía abrumadora. Algunas empresas, como Honeywell, recientemente han intentado de manera similar cerrar el uso ‘deshonesto’ de herramientas de codificación de IA no aprobadas por TI.

Las empresas inteligentes ya están estableciendo entornos de sandbox seguros para facilitar la experimentación controlada. Las organizaciones que establecen barreras claras mientras fomentan la innovación cosecharán los beneficios tanto del entusiasmo de los empleados como de las ideas sobre cómo estas herramientas pueden servir mejor a sus necesidades únicas, posicionándose por delante de los competidores que se resisten al cambio. Y Claude de Anthropic, al menos por el momento, es un gran beneficiario de este movimiento transformador.