Claude: O Agente de Código Preferido

Claude 3.7 Sonnet: Um Novo Marco na Proficiência em Codificação

O recente lançamento do Claude 3.7 Sonnet, há apenas duas semanas, serve como evidência convincente. Esta última iteração quebrou os recordes existentes de desempenho em codificação. Simultaneamente, a Anthropic revelou o Claude Code, um agente de IA de linha de comando projetado para acelerar o desenvolvimento de aplicações para programadores. Somando-se a este momento, o Cursor, um editor de código com tecnologia de IA que usa por padrão o modelo Claude da Anthropic, supostamente disparou para impressionantes US$ 100 milhões em receita anual recorrente em apenas 12 meses.

A ênfase deliberada da Anthropic na codificação coincide com o crescente reconhecimento entre as empresas do potencial transformador dos agentes de codificação de IA. Esses agentes capacitam tanto desenvolvedores experientes quanto indivíduos sem experiência em codificação a criar aplicações com velocidade e eficiência sem precedentes. Como Guillermo Rauch, CEO da Vercel, uma empresa em rápida expansão que permite que desenvolvedores (incluindo não codificadores) implantem aplicações de front-end, afirmou apropriadamente, ‘Anthropic continua a sair por cima’. A decisão da Vercel no ano passado de mudar seu principal modelo de codificação do GPT da OpenAI para o Claude da Anthropic, após uma avaliação completa de seu desempenho em tarefas cruciais de codificação, ressalta este ponto.

O Claude 3.7 Sonnet, lançado em 24 de fevereiro, demonstrou assumir a liderança em quase todos os benchmarks de codificação. Ele alcançou notáveis 70,3% no altamente respeitado benchmark SWE-bench, uma medida das capacidades de desenvolvimento de software de um agente. Esta pontuação supera significativamente as de seus concorrentes mais próximos, o1 da OpenAI (48,9%) e DeepSeek-R1 (49,2%). Além disso, o Claude 3.7 exibe desempenho superior em tarefas agenticas.

Esses resultados de benchmark foram rapidamente validados pelas comunidades de desenvolvedores por meio de testes no mundo real. Discussões online, particularmente em plataformas como o Reddit, comparando o Claude 3.7 com o Grok 3 (o modelo mais recente da xAI de Elon Musk), consistentemente favorecem o modelo da Anthropic para tarefas de codificação. Um dos principais comentadores resumiu o sentimento: ‘Com base no que testei, o Claude 3.7 parece ser o melhor para escrever código (pelo menos para mim)’. É muito importante observar que até mesmo Manus, o novo agente multiuso chinês que conquistou o mundo no início desta semana, disse que era melhor do que o Deep Research da Open AI e outras tarefas autónomas, foi amplamente construído no Claude.

Foco Estratégico: O Jogo Empresarial da Anthropic

O foco inabalável da Anthropic nos recursos de codificação está longe de ser acidental. Projeções vazadas relatadas pelo The Information sugerem que a Anthropic está almejando impressionantes US$ 34,5 bilhões em receita até 2027. Isso representa um aumento de 86 vezes em relação aos seus níveis atuais. Espera-se que uma parte substancial (aproximadamente 67%) dessa receita projetada derive do negócio de API, com aplicações de codificação empresarial servindo como o principal motor de crescimento. Embora a Anthropic não tenha divulgado números precisos de receita, relatou um aumento notável de 1.000% na receita de codificação durante o último trimestre de 2024. Somando-se a esse impulso financeiro, a Anthropic anunciou recentemente uma rodada de financiamento de US$ 3,5 bilhões, avaliando a empresa em impressionantes US$ 61,5 bilhões.

Essa estratégia centrada em codificação alinha-se com as descobertas do próprio Índice Económico da Anthropic. O índice revelou que significativos 37,2% das consultas direcionadas ao Claude se enquadravam na categoria ‘computacional e matemática’. Essas consultas abrangiam principalmente tarefas de engenharia de software, como modificação de código, depuração e solução de problemas de rede.

A abordagem da Anthropic destaca-se no cenário competitivo, onde os rivais são frequentemente apanhados num turbilhão de atividades, tentando atender aos mercados empresarial e de consumo com uma ampla gama de recursos. A OpenAI, embora mantenha uma forte liderança devido ao seu reconhecimento e adoção precoce pelo consumidor, enfrenta o desafio de atender tanto usuários regulares quanto empresas com uma variedade diversificada de modelos e funcionalidades. O Google, da mesma forma, está a seguir uma estratégia de oferecer um portfólio de produtos de amplo alcance.

A abordagem comparativamente disciplinada da Anthropic também se reflete nas suas decisões de produto. Em vez de perseguir a participação no mercado de consumo, a empresa priorizou recursos de nível empresarial, como integração com GitHub, logs de auditoria, permissões personalizáveis e controlos de segurança específicos do domínio. Seis meses antes, introduziu uma enorme janela de contexto de 500.000 tokens para desenvolvedores, um contraste gritante com a decisão do Google de limitar sua janela de 1 milhão de tokens a testadores privados. Esse foco estratégico resultou numa oferta abrangente e centrada em codificação que está a ressoar cada vez mais com as empresas.

A recente introdução pela empresa de recursos que permitem que não codificadores publiquem aplicações geradas por IA dentro de suas organizações, juntamente com a atualização do console da semana passada com recursos de colaboração aprimorados (incluindo prompts e modelos compartilháveis), exemplifica ainda mais essa tendência. Essa democratização reflete uma estratégia de ‘Cavalo de Troia’: inicialmente capacitando os desenvolvedores a construir bases robustas, seguido pela expansão do acesso à força de trabalho empresarial mais ampla, atingindo finalmente o conjunto corporativo.

Experiência Prática com o Claude: Um Experimento Prático

Para avaliar as capacidades do mundo real desses agentes de codificação, foi realizado um experimento prático, com foco na construção de um banco de dados para armazenar artigos. Três abordagens distintas foram empregadas: Claude 3.7 Sonnet através da aplicação da Anthropic, o agente de codificação do Cursor e o Claude Code.

Utilizando o Claude 3.7 diretamente através da aplicação da Anthropic, a orientação fornecida foi notavelmente perspicaz, particularmente para alguém sem vasta experiência em codificação. O modelo apresentou várias opções, desde soluções robustas empregando bancos de dados PostgreSQL até alternativas mais leves como o Airtable. Optando pela solução leve, o Claude guiou metodicamente o processo de extração de artigos de uma API e sua integração no Airtable usando um serviço de conector. Embora o processo tenha levado aproximadamente duas horas, principalmente devido a desafios de autenticação, culminou num sistema funcional. Essencialmente, em vez de escrever autonomamente todo o código, o Claude forneceu um plano abrangente para alcançar o resultado desejado.

O Cursor, com sua dependência padrão dos modelos do Claude, apresentou uma experiência de editor de código completa e exibiu uma maior inclinação para a automação. No entanto, exigia permissão em cada etapa, resultando num fluxo de trabalho um tanto iterativo.

O Claude Code ofereceu uma abordagem diferente, operando diretamente dentro do terminal e utilizando o SQLite para criar um banco de dados local preenchido com artigos de um feed RSS. Esta solução provou ser mais simples e confiável para atingir o objetivo final, embora menos robusta e rica em recursos em comparação com a implementação do Airtable. Isso destaca as compensações inerentes envolvidas e ressalta a importância de selecionar um agente de codificação com base nos requisitos específicos do projeto.

A principal conclusão deste experimento é que, mesmo como um não desenvolvedor, foi possível construir aplicações de banco de dados funcionais usando as três abordagens. Isso teria sido virtualmente inimaginável há apenas um ano. E, notavelmente, todas as três abordagens basearam-se nas capacidades subjacentes do Claude.

O Ecossistema de Agentes de Codificação: Cursor e Além

Talvez o indicador mais convincente do sucesso da Anthropic seja o crescimento fenomenal do Cursor, um editor de código de IA. Os relatórios indicam que o Cursor acumulou 360.000 usuários, com mais de 40.000 deles sendo clientes pagantes, em apenas 12 meses. Essa rápida trajetória de crescimento potencialmente posiciona o Cursor como a empresa SaaS mais rápida a atingir esse marco.

O sucesso do Cursor está intrinsecamente ligado ao Claude. Como Sam Witteveen, cofundador da Red Dragon (um desenvolvedor independente de agentes de IA), observou: ‘Você tem que pensar que o cliente número um deles é o Cursor. A maioria das pessoas no [Cursor] já estava a usar o modelo Claude Sonnet – os modelos 3.5. E agora parece que todos estão a migrar para o 3.7’.

O relacionamento entre a Anthropic e seu ecossistema estende-se além de empresas individuais como o Cursor. Em novembro, a Anthropic introduziu seu Model Context Protocol (MCP) como um padrão aberto, permitindo que os desenvolvedores construam ferramentas que interagem perfeitamente com os modelos Claude. Este padrão ganhou ampla adoção na comunidade de desenvolvedores.

Witteveen explicou o significado desta abordagem: ‘Ao lançar isso como um protocolo aberto, eles estão a dizer: ‘Ei, pessoal, divirtam-se. Vocês podem desenvolver o que quiserem que se encaixe neste protocolo. Nós vamos apoiar este protocolo’’.

Essa estratégia cria um ciclo virtuoso: os desenvolvedores constroem ferramentas especificamente para o Claude, aprimorando sua proposta de valor para as empresas, o que, por sua vez, impulsiona ainda mais a adoção e atrai mais desenvolvedores.

O Cenário Competitivo: Microsoft, OpenAI, Google e Código Aberto

Embora a Anthropic tenha conquistado um nicho com sua abordagem focada, os concorrentes estão a seguir diversas estratégias com diferentes graus de sucesso.

A Microsoft mantém uma forte posição através do seu GitHub Copilot, ostentando 1,3 milhão de usuários pagos e adoção por mais de 77.000 organizações em aproximadamente dois anos. Empresas proeminentes como Honeywell, State Street, TD Bank Group e Levi’s estão entre seus usuários. Essa ampla adoção é amplamente atribuída aos relacionamentos empresariais existentes da Microsoft e à sua vantagem de pioneirismo, decorrente de seu investimento inicial na OpenAI e da utilização dos modelos da OpenAI para alimentar o Copilot.

No entanto, até mesmo a Microsoft reconheceu os pontos fortes da Anthropic. Em outubro, permitiu que os usuários do GitHub Copilot selecionassem os modelos da Anthropic como uma alternativa às ofertas da OpenAI. Além disso, os modelos recentes da OpenAI, o1 e o mais novo o3 (que enfatizam o raciocínio através do pensamento estendido), não demonstraram vantagens particulares em codificação ou tarefas agenticas.

O Google fez sua própria jogada ao oferecer recentemente seu Code Assist gratuitamente, mas isso parece ser mais uma manobra defensiva do que uma iniciativa estratégica.

O movimento de código aberto representa outra força significativa neste cenário. Os modelos Llama da Meta conquistaram uma tração empresarial substancial, com grandes empresas como AT&T, DoorDash e Goldman Sachs implantando modelos baseados em Llama para várias aplicações. A abordagem de código aberto oferece às empresas maior controlo, opções de personalização e benefícios de custo que os modelos fechados muitas vezes não conseguem igualar.

Em vez de ver isso como uma ameaça direta, a Anthropic parece estar a posicionar-se como complementar ao código aberto. Os clientes empresariais podem aproveitar o Claude em conjunto com modelos de código aberto, dependendo de seus requisitos específicos, adotando uma abordagem híbrida que maximiza os pontos fortes de cada um.

Na verdade, muitas empresas de grande escala adotaram uma abordagem multimodal, utilizando o modelo mais adequado para uma determinada tarefa. A Intuit, por exemplo, inicialmente confiou na OpenAI como padrão para suas aplicações de declaração de impostos, mas posteriormente mudou para o Claude devido ao seu desempenho superior em certos cenários. Essa experiência levou a Intuit a desenvolver uma estrutura de orquestração de IA que facilitou a troca perfeita entre os modelos.

A maioria das outras empresas adotou desde então uma prática semelhante, empregando o modelo mais apropriado para cada caso de uso específico, muitas vezes integrando modelos através de simples chamadas de API. Embora um modelo de código aberto como o Llama possa ser adequado em alguns casos, o Claude é frequentemente a escolha preferida para tarefas que exigem alta precisão, como cálculos.

Implicações Empresariais: Navegando na Mudança para Agentes de Codificação

Para os tomadores de decisão empresariais, este cenário em rápida evolução apresenta oportunidades e desafios.

A segurança continua a ser uma preocupação primordial, mas um relatório independente recente identificou o Claude 3.7 Sonnet como o modelo mais seguro até o momento, sendo o único testado que se mostrou ‘à prova de jailbreak’. Essa postura de segurança, combinada com o apoio da Anthropic do Google e da Amazon (e integração no AWS Bedrock), posiciona-o favoravelmente para adoção empresarial.

A proliferação de agentes de codificação não está apenas a transformar a forma como as aplicações são desenvolvidas; está a democratizar o processo. De acordo com o GitHub, substanciais 92% dos desenvolvedores baseados nos EUA em empresas já estavam a utilizar ferramentas de codificação com tecnologia de IA no trabalho há 18 meses. Este número provavelmente aumentou significativamente desde então.

Witteveen destacou a ponte entre os membros da equipa técnica e não técnica: ‘O desafio que as pessoas estão a ter [por causa de] não serem codificadores é realmente que eles não conhecem muita da terminologia. Eles não conhecem as melhores práticas’. Os agentes de codificação de IA estão cada vez mais a enfrentar esse desafio, permitindo uma colaboração mais eficaz.

Para a adoção empresarial, Witteveen defende uma abordagem equilibrada: ‘É o equilíbrio entre segurança e experimentação no momento. Claramente, do lado do desenvolvedor, as pessoas estão a começar a construir aplicações do mundo real com essas coisas’.

O surgimento de agentes de codificação de IA significa uma mudança fundamental no desenvolvimento de software empresarial. Quando implantadas de forma eficaz, essas ferramentas não substituem os desenvolvedores, mas sim transformam suas funções, permitindo que se concentrem na arquitetura e inovação em vez de detalhes de implementação.

A abordagem disciplinada da Anthropic, focando especificamente nos recursos de codificação enquanto os concorrentes perseguem múltiplas prioridades, parece estar a render vantagens significativas. Até o final de 2025, este período pode ser visto retrospectivamente como o momento crucial em que os agentes de codificação de IA se tornaram ferramentas empresariais indispensáveis, com o Claude a liderar o ataque.

Para os tomadores de decisão técnica, o imperativo é claro: iniciar a experimentação com essas ferramentas imediatamente ou correr o risco de ficar para trás dos concorrentes que já as estão a aproveitar para acelerar drasticamente os ciclos de desenvolvimento. Esta situação espelha os primeiros dias da revolução do iPhone, onde as empresas inicialmente tentaram restringir dispositivos ‘não sancionados’ de suas redes corporativas, apenas para eventualmente abraçar políticas BYOD à medida que a demanda dos funcionários se tornava esmagadora. Algumas empresas, como a Honeywell, tentaram recentemente encerrar o uso ‘desonesto’ de ferramentas de codificação de IA não aprovadas pela TI.

Empresas inteligentes já estão a estabelecer ambientes de sandbox seguros para facilitar a experimentação controlada. As organizações que estabelecem barreiras claras enquanto promovem a inovação colherão os benefícios do entusiasmo dos funcionários e insights sobre como essas ferramentas podem melhor atender às suas necessidades exclusivas, posicionando-se à frente dos concorrentes que resistem à mudança. E o Claude da Anthropic, pelo menos no momento, é um grande beneficiário desse movimento transformador.