Anthropic ha lanzado recientemente sus modelos de IA de nueva generación, Claude Opus 4 y Claude Sonnet 4, estableciendo nuevos puntos de referencia en codificación, razonamiento avanzado y capacidades de agentes de IA. Estos modelos representan un avance significativo, que ofrece un rendimiento y una precisión mejorados para una amplia gama de tareas complejas.
Claude Opus 4: El principal modelo de codificación del mundo
Claude Opus 4 destaca como el mejor modelo de codificación del mundo, lo que demuestra un rendimiento excepcional y constante en tareas intrincadas y de larga duración. Su capacidad para gestionar flujos de trabajo de agentes y de pensamiento prolongado lo convierte en un activo invaluable para los desarrolladores que abordan desafíos de codificación complejos. La destreza de este modelo se extiende a la comprensión de bases de código complejas, la realización de cambios precisos en varios archivos y el aumento de la calidad del código durante la edición y la depuración. Varios líderes de la industria han elogiado a Claude Opus 4 por sus capacidades:
- Cursor: Lo elogia como de última generación para la codificación y un avance significativo en la comprensión de bases de código complejas.
- Replit: Destaca su precisión mejorada y las mejoras drásticas para cambios complejos en numerosos archivos.
- Block: Lo reconoce como el primer modelo en mejorar la calidad del código durante la edición y la depuración dentro de su agente, con el nombre en clave “goose”, manteniendo al mismo tiempo el máximo rendimiento y fiabilidad.
- Rakuten: Validó sus capacidades con una refactorización de código abierto exigente, que se ejecutó de forma independiente durante 7 horas con un rendimiento constante.
- Cognition: Reconoce que Opus 4 sobresale en la resolución de desafíos intrincados con los que otros modelos tienen problemas, manejando con éxito acciones críticas que los modelos anteriores han pasado por alto.
Claude Sonnet 4: Una actualización significativa
Claude Sonnet 4 representa una actualización sustancial de su predecesor, Claude Sonnet 3.7. Ofrece habilidades superiores de codificación y razonamiento al tiempo que responde con mayor precisión a las instrucciones del usuario. Este modelo logra un equilibrio óptimo entre rendimiento y eficiencia, lo que lo hace adecuado para una amplia gama de casos de uso internos y externos. Si bien puede que no supere a Opus 4 en todos los dominios, ofrece una combinación ideal de capacidad y practicidad. Los aspectos más destacados de Claude Sonnet 4 incluyen:
- GitHub: Afirma que Claude Sonnet 4 sobresale en escenarios de agentes y se integrará como el modelo que impulsa el nuevo agente de codificación en GitHub Copilot.
- Manus: Enfatiza las mejoras en el seguimiento de instrucciones complejas, el razonamiento claro y las salidas estéticamente agradables.
- iGent: Informa de que Sonnet 4 sobresale en el desarrollo autónomo de aplicaciones multifunción, así como en la resolución de problemas y la navegación por la base de código significativamente mejoradas, lo que reduce los errores de navegación del 20% a casi cero.
- Sourcegraph: Sugiere que el modelo es prometedor como un salto sustancial en el desarrollo de software, manteniendo el enfoque durante más tiempo, comprendiendo los problemas más profundamente y proporcionando una calidad de código más elegante.
- Augment Code: Informa de tasas de éxito más altas, ediciones de código más quirúrgicas y un trabajo más cuidadoso en tareas complejas, lo que lo convierte en la mejor opción para su modelo principal.
Pensamiento extendido con uso de herramientas
Tanto Claude Opus 4 como Claude Sonnet 4 cuentan con capacidades de pensamiento extendido con el uso de herramientas, lo que les permite aprovechar herramientas externas para mejorar sus habilidades de razonamiento y resolución de problemas. Esto permite a Claude alternar entre el razonamiento y el uso de herramientas, lo que conduce a respuestas mejoradas y resultados más precisos. Los modelos también pueden ejecutar herramientas en paralelo, seguir instrucciones con mayor precisión y demostrar capacidades de memoria significativamente mejoradas. Esto se logra extrayendo y guardando hechos clave para mantener la continuidad y construir conocimiento tácito con el tiempo.
Claude Code: Ahora disponible para el público en general
Claude Code, ahora disponible para el público en general, ofrece a los desarrolladores mayores oportunidades para colaborar con Claude. Admite tareas en segundo plano a través de GitHub Actions e integraciones nativas con VS Code y JetBrains. Las ediciones se muestran directamente en sus archivos, lo que facilita la programación en pareja y el desarrollo colaborativo sin problemas. Esta característica ha recibido comentarios positivos extensos durante la vista previa de la investigación, lo que destaca su valor para optimizar los flujos de trabajo de desarrollo.
Nuevas capacidades de API
Anthropic también ha lanzado cuatro nuevas capacidades en la Anthropic API, lo que permite a los desarrolladores construir agentes de IA más potentes. Estas capacidades incluyen:
- Code Execution Tool: Permite a los agentes ejecutar fragmentos de código para resolver problemas complejos.
- MCP Connector: Permite a los agentes interactuar con fuentes de datos y servicios externos.
- Files API: Proporciona a los agentes acceso a los sistemas de archivos locales para mejorar el procesamiento de datos.
- Prompt Caching: Permite a los desarrolladores almacenar en caché las instrucciones durante un máximo de una hora, lo que reduce la latencia y mejora el rendimiento.
Modelos híbridos con modos duales
Claude Opus 4 y Sonnet 4 son modelos híbridos que ofrecen dos modos distintos:
- Respuestas casi instantáneas: Proporciona respuestas rápidas y eficientes para consultas rutinarias.
- Pensamiento extendido: Permite un razonamiento y una resolución de problemas más profundos para tareas complejas.
Los planes Pro, Max, Team y Enterprise Claude incluyen ambos modelos y capacidades de pensamiento extendido. Claude Sonnet 4 también es accesible para usuarios gratuitos. Ambos modelos están disponibles en la Anthropic API, Amazon Bedrock y Vertex AI de Google Cloud, lo que garantiza una amplia accesibilidad para desarrolladores y organizaciones.
Consistencia de precios
El precio de Claude Opus 4 y Sonnet 4 sigue siendo coherente con los modelos anteriores de Opus y Sonnet:
- Opus 4: $15/$75 por millón de tokens (entrada/salida)
- Sonnet 4: $3/$15 por millón de tokens (entrada/salida)
Mejoras del modelo: Accesos directos reducidos y memoria mejorada
Además del pensamiento extendido con el uso de herramientas, la ejecución paralela de herramientas y las mejoras de memoria, Anthropic ha reducido significativamente la incidencia de modelos que utilizan accesos directos o lagunas para completar tareas. Ambos modelos tienen un 65% menos de probabilidades de participar en este comportamiento en comparación con Sonnet 3.7 en tareas de agentes. Claude Opus 4 también supera drásticamente a todos los modelos anteriores en términos de capacidades de memoria. Cuando los desarrolladores crean aplicaciones que brindan a Claude acceso al archivo local, Opus 4 sobresale en la creación y el mantenimiento de ‘archivos de memoria’ para almacenar información clave. Esto desbloquea una mejor conciencia de las tareas a largo plazo, coherencia y rendimiento en las tareas del agente, lo que permite escenarios como Opus 4 que crea una ‘Guía de navegación’ mientras juega Pokémon.
Resúmenes de pensamiento
Anthropic ha introducido resúmenes de pensamiento para los modelos de Claude 4, que utilizan un modelo más pequeño para condensar los largos procesos de pensamiento. Esta característica solo se utiliza aproximadamente el 5% del tiempo, ya que la mayoría de los procesos de pensamiento son lo suficientemente cortos como para mostrarse en su totalidad. Los usuarios que requieran cadenas de pensamiento sin procesar para la ingeniería de avisos avanzada pueden ponerse en contacto con el departamento de ventas para obtener información sobre el nuevo modo para desarrolladores de Anthropic para conservar el acceso completo.
Integración de Claude Code
Claude Code ahora está integrado en una mayor parte de su flujo de trabajo de desarrollo, incluido el terminal, sus IDE preferidos y la ejecución en segundo plano con el Claude Code SDK. Las nuevas extensiones beta para VS Code y JetBrains integran a la perfección Claude Code directamente en su IDE. Las ediciones propuestas por Claude aparecen en línea en sus archivos, lo que agiliza la revisión y el seguimiento dentro de la interfaz familiar del editor. Para instalar, simplemente ejecute Claude Code en el terminal de su IDE.
Extensible Claude Code SDK
Además del IDE, Anthropic está lanzando un extensible Claude Code SDK, lo que permite a los usuarios crear sus propios agentes y aplicaciones utilizando el mismo agente central que Claude Code. Un ejemplo de lo que es posible con el SDK es Claude Code en GitHub, ahora en versión beta. Etiquete Claude Code en las PR (Pull Request) para responder a los comentarios de los revisores, corregir errores de CI o modificar el código. Para instalar, ejecute /install-github-app desde dentro de Claude Code.
Un paso hacia la colaboración virtual
Estos modelos representan un avance significativo hacia el colaborador virtual, manteniendo el contexto completo, manteniendo el enfoque en proyectos más largos e impulsando un impacto transformacional. Se someten a pruebas y evaluaciones exhaustivas para minimizar el riesgo y maximizar la seguridad, incluida la implementación de medidas para niveles de seguridad de IA más altos como ASL-3.
Estos avances prometen posibilidades interesantes para diversas aplicaciones, con Opus 4 superando los límites en la codificación, la investigación, la escritura y el descubrimiento científico, y Sonnet 4 aportando un rendimiento de vanguardia a los casos de uso cotidianos como una actualización instantánea de Sonnet 3.7.