A Anthropic lançou recentemente seus modelos de IA de próxima geração, Claude Opus 4 e Claude Sonnet 4, estabelecendo novos referenciais em codificação, raciocínio avançado e capacidades de agentes de IA. Esses modelos representam um avanço significativo, oferecendo desempenho e precisão aprimorados para uma ampla gama de tarefas complexas.
Claude Opus 4: O Melhor Modelo de Codificação do Mundo
Claude Opus 4 se destaca como o melhor modelo de codificação do mundo, demonstrando desempenho excepcional e consistente em tarefas intrincadas e de longa duração. Sua capacidade de lidar com pensamento prolongado e fluxos de trabalho de agentes o torna um ativo inestimável para desenvolvedores que lidam com desafios complexos de codificação. A proeza desse modelo se estende à compreensão de bases de código complexas, fazendo alterações precisas em vários arquivos e aumentando a qualidade do código durante a edição e a depuração. Vários líderes do setor elogiaram o Claude Opus 4 por suas capacidades:
- Cursor: Elogia-o como sendo de última geração para codificação e um avanço significativo na compreensão de bases de código complexas.
- Replit: Destaca sua precisão aprimorada e melhorias dramáticas para mudanças complexas em vários arquivos.
- Block: Reconhece-o como o primeiro modelo a aprimorar a qualidade do código durante a edição e a depuração dentro de seu agente, codinome "goose", mantendo o pico de desempenho e confiabilidade.
- Rakuten: Validou suas capacidades com uma refatoração de código aberto exigente, que foi executada independentemente por 7 horas com desempenho consistente.
- Cognition: Reconhece que o Opus 4 se destaca na resolução de desafios intrincados com os quais outros modelos lutam, lidando com sucesso com ações críticas que os modelos anteriores perderam.
Claude Sonnet 4: Uma Atualização Significativa
Claude Sonnet 4 representa uma atualização substancial de seu antecessor, Claude Sonnet 3.7. Ele oferece habilidades superiores de codificação e raciocínio, ao mesmo tempo em que responde com mais precisão às instruções do usuário. Este modelo atinge um equilíbrio ideal entre desempenho e eficiência, tornando-o adequado para uma ampla gama de casos de uso internos e externos. Embora possa não superar o Opus 4 em todos os domínios, ele oferece uma combinação ideal de capacidade e praticidade. Os principais destaques do Claude Sonnet 4 incluem:
- GitHub: Afirma que o Claude Sonnet 4 se destaca em cenários agenticos e será integrado como o modelo que alimenta o novo agente de codificação no GitHub Copilot.
- Manus: Enfatiza melhorias no seguimento de instruções complexas, raciocínio claro e saídas esteticamente agradáveis.
- iGent: Relata que o Sonnet 4 se destaca no desenvolvimento autônomo de aplicativos com vários recursos, bem como na resolução de problemas e na navegação na base de código significativamente aprimoradas, reduzindo os erros de navegação de 20% para quase zero.
- Sourcegraph: Sugere que o modelo mostra promessa como um salto substancial no desenvolvimento de software, mantendo o foco por durações mais longas, entendendo os problemas mais profundamente e fornecendo uma qualidade de código mais elegante.
- Augment Code: Relata taxas de sucesso mais altas, edições de código mais cirúrgicas e um trabalho mais cuidadoso em tarefas complexas, tornando-o a melhor escolha para seu modelo primário.
Pensamento Extendido com Uso de Ferramentas
Tanto o Claude Opus 4 quanto o Claude Sonnet 4 apresentam capacidades de pensamento estendido com uso de ferramentas, permitindo-lhes alavancar ferramentas externas para aprimorar suas habilidades de raciocínio e resolução de problemas. Isso permite que Claude alterne entre raciocínio e uso de ferramentas, levando a respostas aprimoradas e resultados mais precisos. Os modelos também podem executar ferramentas em paralelo, seguir instruções com maior precisão e demonstrar capacidades de memória significativamente aprimoradas. Isso é alcançado extraindo e salvando fatos-chave para manter a continuidade e construir conhecimento tácito ao longo do tempo.
Claude Code: Agora Geralmente Disponível
Claude Code, agora geralmente disponível, oferece aos desenvolvedores oportunidades expandidas para colaborar com Claude. Ele oferece suporte a tarefas em segundo plano por meio de GitHub Actions e integrações nativas com VS Code e JetBrains. As edições são exibidas diretamente em seus arquivos, facilitando a programação em pares e o desenvolvimento colaborativo sem problemas. Esse recurso recebeu um feedback positivo extenso durante a visualização da pesquisa, destacando seu valor na simplificação dos fluxos de trabalho de desenvolvimento.
Novas Capacidades de API
A Anthropic também lançou quatro novas capacidades na Anthropic API, capacitando os desenvolvedores a construir agentes de IA mais poderosos. Essas capacidades incluem:
- Code Execution Tool: Permite que os agentes executem trechos de código para resolver problemas complexos.
- MCP Connector: Permite que os agentes interajam com fontes de dados e serviços externos.
- Files API: Fornece aos agentes acesso a sistemas de arquivos locais para processamento de dados aprimorado.
- Prompt Caching: Permite que os desenvolvedores armazenem prompts em cache por até uma hora, reduzindo a latência e melhorando o desempenho.
Modelos Híbridos com Modos Duplos
Claude Opus 4 e Sonnet 4 são modelos híbridos que oferecem dois modos distintos:
- Respostas Quase Instantâneas: Fornece respostas rápidas e eficientes para consultas de rotina.
- Pensamento Extendido: Permite raciocínio e resolução de problemas mais profundos para tarefas complexas.
Os planos Pro, Max, Team e Enterprise Claude incluem ambos os modelos e capacidades de pensamento estendido. Claude Sonnet 4 também está acessível a usuários gratuitos. Ambos os modelos estão disponíveis na Anthropic API, Amazon Bedrock e Vertex AI do Google Cloud, garantindo ampla acessibilidade para desenvolvedores e organizações.
Consistência de Preços
O preço para Claude Opus 4 e Sonnet 4 permanece consistente com os modelos Opus e Sonnet anteriores:
- Opus 4: $15/$75 por milhão de tokens (entrada/saída)
- Sonnet 4: $3/$15 por milhão de tokens (entrada/saída)
Melhorias no Modelo: Redução de Atalhos e Memória Aprimorada
Além do pensamento estendido com uso de ferramentas, execução paralela de ferramentas e melhorias de memória, a Anthropic reduziu significativamente a ocorrência de modelos usando atalhos ou brechas para concluir tarefas. Ambos os modelos são 65% menos propensos a se envolver nesse comportamento em comparação com o Sonnet 3.7 em tarefas agenticas. Claude Opus 4 também supera drasticamente todos os modelos anteriores em termos de capacidades de memória. Quando os desenvolvedores constroem aplicativos que fornecem acesso a arquivos locais Claude, o Opus 4 se destaca na criação e manutenção de ‘arquivos de memória’ para armazenar informações-chave. Isso desbloqueia uma melhor conscientização de tarefas de longo prazo, coerência e desempenho em tarefas de agente, permitindo cenários como o Opus 4 criando um ‘Guia de Navegação’ enquanto joga Pokémon.
Resumos de Pensamento
A Anthropic introduziu resumos de pensamento para modelos Claude 4, que usam um modelo menor para condensar processos de pensamento longos. Esse recurso é utilizado apenas aproximadamente 5% das vezes, pois a maioria dos processos de pensamento são curtos o suficiente para serem exibidos na íntegra. Os usuários que exigem cadeias de pensamento brutas para engenharia de prompt avançada podem entrar em contato com as vendas sobre o novo Modo de Desenvolvedor da Anthropic para reter acesso total.
Integração de Claude Code
O Claude Code agora está integrado a mais do seu fluxo de trabalho de desenvolvimento, incluindo o terminal, seus IDEs preferidos e a execução em segundo plano com o SDK Claude Code. Novas extensões beta para VS Code e JetBrains integram perfeitamente o Claude Code diretamente em seu IDE. As edições propostas de Claude aparecem em linha em seus arquivos, simplificando a revisão e o rastreamento na interface do editor familiar. Para instalar, basta executar Claude Code no terminal do seu IDE.
SDK Claude Code Extensível
Além do IDE, a Anthropic está lançando um SDK Claude Code extensível, permitindo que os usuários construam seus próprios agentes e aplicativos usando o mesmo agente principal que o Claude Code. Um exemplo do que é possível com o SDK é o Claude Code no GitHub, agora em beta. Marque o Claude Code em PRs para responder ao feedback do revisor, corrigir erros de CI ou modificar o código. Para instalar, execute /install-github-app de dentro do Claude Code.
Um Passo em Direção à Colaboração Virtual
Esses modelos representam um passo significativo em direção ao colaborador virtual, mantendo o contexto completo, sustentando o foco em projetos mais longos e impulsionando o impacto transformacional. Eles passam por testes e avaliações extensivos para minimizar o risco e maximizar a segurança, incluindo a implementação de medidas para níveis de segurança de IA mais altos, como ASL-3.
Esses avanços prometem possibilidades empolgantes para diversas aplicações, com o Opus 4 ultrapassando os limites em codificação, pesquisa, escrita e descoberta científica, e o Sonnet 4 trazendo desempenho de ponta para casos de uso diários como uma atualização instantânea do Sonnet 3.7.