Anthropic ha recentemente lanciato i suoi modelli AI di nuova generazione, Claude Opus 4 e Claude Sonnet 4, stabilendo nuovi standard di riferimento nel coding, nel ragionamento avanzato e nelle capacità degli agenti AI. Questi modelli rappresentano un significativo passo avanti, offrendo prestazioni e precisione migliorate per un’ampia gamma di compiti complessi.
Claude Opus 4: Il Miglior Modello di Coding al Mondo
Claude Opus 4 si distingue come il miglior modello di coding al mondo, dimostrando prestazioni eccezionali e costanti su compiti intricati e di lunga durata. La sua capacità di gestire processi di pensiero estesi e flussi di lavoro di agenti lo rende una risorsa preziosa per gli sviluppatori che affrontano complesse sfide di coding. La competenza di questo modello si estende alla comprensione di codebase complesse, all’apporto di modifiche precise su più file e al miglioramento della qualità del codice durante l’editing e il debugging. Diversi leader del settore hanno elogiato Claude Opus 4 per le sue capacità:
- Cursor: Lo loda come all’avanguardia per il coding e un significativo progresso nella comprensione di codebase complesse.
- Replit: Evidenzia la sua precisione migliorata e i miglioramenti notevoli per modifiche complesse su numerosi file.
- Block: Lo riconosce come il primo modello a migliorare la qualità del codice durante l’editing e il debugging all’interno del suo agente, nome in codice "goose", mantenendo al contempo prestazioni e affidabilità di picco.
- Rakuten: Ha convalidato le sue capacità con un’impegnativa refactor open-source, eseguita in modo indipendente per 7 ore con prestazioni costanti.
- Cognition: Riconosce che Opus 4 eccelle nella risoluzione di sfide intricate con cui altri modelli faticano, gestendo con successo azioni critiche che i modelli precedenti hanno trascurato.
Claude Sonnet 4: Un Aggiornamento Significativo
Claude Sonnet 4 rappresenta un aggiornamento sostanziale rispetto al suo predecessore, Claude Sonnet 3.7. Offre capacità di coding e ragionamento superiori, rispondendo al contempo in modo più accurato alle istruzioni dell’utente. Questo modello raggiunge un equilibrio ottimale tra prestazioni ed efficienza, rendendolo adatto a un’ampia gamma di casi d’uso interni ed esterni. Anche se potrebbe non superare Opus 4 in tutti i domini, offre una combinazione ideale di capacità e praticità. I punti salienti di Claude Sonnet 4 includono:
- GitHub: Afferma che Claude Sonnet 4 eccelle in scenari agentici e sarà integrato come modello che alimenta il nuovo agente di coding in GitHub Copilot.
- Manus: Sottolinea i miglioramenti nel seguire istruzioni complesse, nel ragionamento chiaro e negli output esteticamente gradevoli.
- iGent: Segnala che Sonnet 4 eccelle nello sviluppo autonomo di app multi-funzionalità, nonché in un problem-solving e una navigazione della codebase significativamente migliorati, riducendo gli errori di navigazione dal 20% a quasi zero.
- Sourcegraph: Suggerisce che il modello si dimostra promettente come un notevole passo avanti nello sviluppo di software, mantenendo la concentrazione per durate più lunghe, comprendendo i problemi più a fondo e fornendo una qualità del codice più elegante.
- Augment Code: Segnala tassi di successo più elevati, modifiche al codice più chirurgiche e un lavoro più attento attraverso compiti complessi, rendendolo la scelta migliore per il loro modello principale.
Pensiero Esteso con Uso di Strumenti
Sia Claude Opus 4 che Claude Sonnet 4 dispongono di capacità di pensiero esteso con l’uso di strumenti, consentendo loro di sfruttare strumenti esterni per migliorare le loro capacità di ragionamento e problem-solving. Questo permette a Claude di alternare tra ragionamento e utilizzo di strumenti, portando a risposte migliorate e risultati più accurati. I modelli possono anche eseguire strumenti in parallelo, seguire le istruzioni con maggiore precisione e dimostrare capacità di memoria notevolmente migliorate. Questo viene ottenuto estraendo e salvando fatti chiave per mantenere la continuità e costruire conoscenza tacita nel tempo.
Claude Code: Ora Generalmente Disponibile
Claude Code, ora generalmente disponibile, offre agli sviluppatori maggiori opportunità di collaborare con Claude. Supporta attività in background tramite GitHub Actions e integrazioni native con VS Code e JetBrains. Le modifiche vengono visualizzate direttamente nei tuoi file, facilitando il pair programming senza interruzioni e lo sviluppo collaborativo. Questa funzionalità ha ricevuto un feedback positivo estensivo durante l’anteprima di ricerca, evidenziandone il valore nella semplificazione dei flussi di lavoro di sviluppo.
Nuove Capacità API
Anthropic ha anche rilasciato quattro nuove funzionalità sull’API Anthropic, consentendo agli sviluppatori di costruire agenti AI più potenti. Queste funzionalità includono:
- Code Execution Tool: Consente agli agenti di eseguire frammenti di codice per risolvere problemi complessi.
- MCP Connector: Permette agli agenti di interagire con fonti di dati e servizi esterni.
- Files API: Fornisce agli agenti l’accesso ai file system locali per un’elaborazione dei dati avanzata.
- Prompt Caching: Permette agli sviluppatori di memorizzare nella cache i prompt per un massimo di un’ora, riducendo la latenza e migliorando le prestazioni.
Modelli Ibridi con Doppia Modalità
Claude Opus 4 e Sonnet 4 sono modelli ibridi che offrono due modalità distinte:
- Risposte Quasi Istantanee: Fornisce risposte rapide ed efficienti per le query di routine.
- Pensiero Esteso: Permette un ragionamento e un problem-solving più approfonditi per compiti complessi.
I piani Pro, Max, Team ed Enterprise di Claude includono entrambi i modelli e capacità di pensiero esteso. Claude Sonnet 4 è anche accessibile agli utenti gratuiti. Entrambi i modelli sono disponibili sull’API Anthropic, Amazon Bedrock e Vertex AI di Google Cloud, garantendo un’ampia accessibilità per sviluppatori e organizzazioni.
Coerenza dei Prezzi
Il prezzo per Claude Opus 4 e Sonnet 4 rimane coerente con i precedenti modelli Opus e Sonnet:
- Opus 4: $15/$75 per milione di token (input/output)
- Sonnet 4: $3/$15 per milione di token (input/output)
Miglioramenti del Modello: Riduzione delle Scorciatoie e Memoria Potenziata
Oltre al pensiero esteso con l’uso di strumenti, all’esecuzione parallela di strumenti e ai miglioramenti della memoria, Anthropic ha ridotto significativamente il verificarsi di modelli che utilizzano scorciatoie o scappatoie per completare i compiti. Entrambi i modelli hanno il 65% in meno di probabilità di impegnarsi in questo comportamento rispetto a Sonnet 3.7 su compiti agentici. Claude Opus 4 supera anche notevolmente tutti i modelli precedenti in termini di capacità di memoria. Quando gli sviluppatori creano applicazioni che forniscono a Claude l’accesso ai file locali, Opus 4 eccelle nella creazione e nella manutenzione di "file di memoria" per memorizzare le informazioni chiave. Questo sblocca una migliore consapevolezza delle attività a lungo termine, coerenza e prestazioni sui compiti degli agenti, abilitando scenari come Opus 4 che crea una "Guida alla Navigazione" mentre gioca a Pokémon.
Riepiloghi di Pensiero
Anthropic ha introdotto riepiloghi del pensiero per i modelli Claude 4, che utilizzano un modello più piccolo per condensare lunghi processi di pensiero. Questa funzionalità viene utilizzata solo circa il 5% delle volte, poiché la maggior parte dei processi di pensiero è abbastanza breve da essere visualizzata per intero. Gli utenti che necessitano di catene di pensiero grezze per l’ingegneria avanzata dei prompt possono contattare le vendite in merito alla nuova modalità sviluppatore di Anthropic per mantenere l’accesso completo.
Integrazione di Claude Code
Claude Code è ora integrato in più del tuo flusso di lavoro di sviluppo, incluso il terminale, i tuoi IDE preferiti e l’esecuzione in background con l’SDK Claude Code. Nuove estensioni beta per VS Code e JetBrains integrano perfettamente Claude Code direttamente nel tuo IDE. Le modifiche proposte da Claude appaiono in linea nei tuoi file, semplificando la revisione e il monitoraggio all’interno dell’interfaccia familiare dell’editor. Per installare, esegui semplicemente Claude Code nel terminale del tuo IDE.
SDK Claude Code Estensibile
Oltre all’IDE, Anthropic sta rilasciando un SDK Claude Code estensibile, consentendo agli utenti di creare i propri agenti e applicazioni utilizzando lo stesso agente principale di Claude Code. Un esempio di ciò che è possibile con l’SDK è Claude Code su GitHub, ora in beta. Taggare Claude Code sui PR per rispondere al feedback del revisore, correggere gli errori CI o modificare il codice. Per installare, esegui /install-github-app dall’interno di Claude Code.
Un Passo Verso la Collaborazione Virtuale
Questi modelli rappresentano un significativo passo avanti verso il collaboratore virtuale, mantenendo il contesto completo, sostenendo la concentrazione su progetti più lunghi e guidando un impatto trasformativo. Subiscono test e valutazioni approfonditi per ridurre al minimo i rischi e massimizzare la sicurezza, inclusa l’implementazione di misure per livelli di sicurezza AI più elevati come ASL-3.
Questi progressi promettono entusiasmanti possibilità per diverse applicazioni, con Opus 4 che spinge i confini nel coding, nella ricerca, nella scrittura e nella scoperta scientifica, e Sonnet 4 che porta prestazioni di frontiera nei casi d’uso quotidiani come un aggiornamento istantaneo da Sonnet 3.7.