Claude 4: Eine neue Ära der KI-Leistung

Anthropic hat kürzlich seine KI-Modelle der nächsten Generation, Claude Opus 4 und Claude Sonnet 4, auf den Markt gebracht, die neue Maßstäbe in den Bereichen Programmierung, fortgeschrittenes Denken und KI-Agentenfähigkeiten setzen. Diese Modelle stellen einen bedeutenden Fortschritt dar und bieten eine verbesserte Leistung und Präzision für eine breite Palette komplexer Aufgaben.

Claude Opus 4: Das weltweit führende Programmiermodell

Claude Opus 4 zeichnet sich als das weltweit beste Programmiermodell aus und demonstriert eine außergewöhnliche und konsistente Leistung bei komplexen, langwierigen Aufgaben. Seine Fähigkeit, lange Denkprozesse und Agenten-Workflows zu bewältigen, macht es zu einem unschätzbaren Vorteil für Entwickler, die komplexe Programmierherausforderungen angehen. Die Fähigkeiten dieses Modells erstrecken sich auf das Verständnis komplexer Codebasen, das präzise Vornehmen von Änderungen über mehrere Dateien hinweg und die Verbesserung der Codequalität während der Bearbeitung und des Debuggings. Mehrere Branchenführer haben Claude Opus 4 für seine Fähigkeiten gelobt:

  • Cursor: Lobt es als State-of-the-Art für die Programmierung und als einen bedeutenden Fortschritt im komplexen Codebasisverständnis.
  • Replit: Hebt seine verbesserte Präzision und die dramatischen Verbesserungen für komplexe Änderungen über zahlreiche Dateien hinweg hervor.
  • Block: Erkennt es als das erste Modell an, das die Codequalität während der Bearbeitung und des Debuggings innerhalb seines Agenten mit dem Codenamen "goose" verbessert und gleichzeitig Spitzenleistung und Zuverlässigkeit beibehält.
  • Rakuten: Validierte seine Fähigkeiten mit einem anspruchsvollen Open-Source-Refactor, der 7 Stunden lang unabhängig mit konsistenter Leistung lief.
  • Cognition: Bestätigt, dass Opus 4 sich bei der Lösung komplizierter Herausforderungen auszeichnet, mit denen andere Modelle zu kämpfen haben, und kritische Aktionen erfolgreich bewältigt, die frühere Modelle übersehen haben.

Claude Opus 4 ist nicht nur ein weiteres KI-Modell; es ist ein Game-Changer für die Softwareentwicklung. Seine Fähigkeit, komplexe Codebasen zu verstehen, ist unvergleichlich. Dies bedeutet, dass Entwickler weniger Zeit mit dem Entschlüsseln von Legacy-Code verbringen und sich stattdessen auf die Erstellung neuer Funktionen und die Lösung komplexer Probleme konzentrieren können. Die Präzision des Modells bei der Durchführung von Änderungen über mehrere Dateien hinweg ist ebenfalls ein großer Vorteil. In der Vergangenheit war dies ein manueller Prozess, der anfällig für Fehler war. Claude Opus 4 automatisiert diesen Prozess und reduziert das Risiko, Fehler einzuführen.

Darüber hinaus ist die Fähigkeit von Claude Opus 4, die Codequalität während der Bearbeitung und des Debuggings zu verbessern, revolutionär. Dies bedeutet, dass Entwickler nicht mehr bis zum Ende des Entwicklungszyklus warten müssen, um Code zu optimieren. Stattdessen kann Claude Opus 4 den Code in Echtzeit verbessern, was zu saubererem, effizienterem und wartbarerem Code führt. Die Validierung durch Rakuten, die einen 7-stündigen Open-Source-Refactor mit konsistenter Leistung durchgeführt haben, ist ein Beweis für die Robustheit und Zuverlässigkeit des Modells. Schließlich ist die Anerkennung durch Cognition, dass Opus 4 sich bei der Lösung komplizierter Herausforderungen auszeichnet, die andere Modelle übersehen haben, ein Zeichen für die fortschrittlichen Denkfähigkeiten des Modells.

Claude Sonnet 4: Ein deutliches Upgrade

Claude Sonnet 4 stellt ein deutliches Upgrade gegenüber seinem Vorgänger, Claude Sonnet 3.7, dar. Es bietet überlegene Codierungs- und Denkfähigkeiten und reagiert gleichzeitig genauer auf Benutzeranweisungen. Dieses Modell bietet ein optimales Gleichgewicht zwischen Leistung und Effizienz und eignet sich daher für eine Vielzahl interner und externer Anwendungsfälle. Obwohl es Opus 4 in allen Bereichen möglicherweise nicht übertrifft, bietet es eine ideale Kombination aus Leistungsfähigkeit und Praktikabilität. Zu den wichtigsten Highlights von Claude Sonnet 4 gehören:

  • GitHub: Gibt an, dass Claude Sonnet 4 sich in agentischen Szenarien auszeichnet und als Modell in den neuen Codierungsagenten in GitHub Copilot integriert wird.
  • Manus: Betont Verbesserungen bei der Befolgung komplexer Anweisungen, klaren Denkprozessen und ästhetisch ansprechenden Ergebnissen.
  • iGent: Berichtet, dass Sonnet 4 sich bei der autonomen Entwicklung von Multi-Feature-Apps sowie bei deutlich verbesserter Problemlösung und Codebasisnavigation auszeichnet, wodurch Navigationsfehler von 20 % auf nahezu Null reduziert werden.
  • Sourcegraph: Legt nahe, dass das Modell ein vielversprechender großer Sprung in der Softwareentwicklung ist, der den Fokus über längere Zeiträume aufrechterhält, Probleme tiefer versteht und eine elegantere Codequalität bietet.
  • Augment Code: Meldet höhere Erfolgsraten, chirurgischere Codebearbeitungen und sorgfältigeres Arbeiten durch komplexe Aufgaben, was es zur ersten Wahl für ihr primäres Modell macht.

Claude Sonnet 4 ist ein vielseitiges Modell, das für eine breite Palette von Aufgaben geeignet ist. Seine überlegenen Codierungs- und Denkfähigkeiten machen es zu einem wertvollen Werkzeug für Entwickler, die schnell und effizient Code erstellen müssen. Die verbesserte Genauigkeit bei der Reaktion auf Benutzeranweisungen bedeutet, dass Entwickler weniger Zeit mit der Fehlerbehebung verbringen müssen. Darüber hinaus bietet das optimale Gleichgewicht zwischen Leistung und Effizienz von Claude Sonnet 4 Entwicklern die Möglichkeit, KI zu nutzen, ohne die Bank zu sprengen. Die Integration in GitHub Copilot ist ein Beweis für die Praktikabilität des Modells.

Die Verbesserungen bei der Befolgung komplexer Anweisungen, den klaren Denkprozessen und den ästhetisch ansprechenden Ergebnissen, die von Manus hervorgehoben werden, machen Claude Sonnet 4 auch für andere Aufgaben als die reine Codierung geeignet. Beispielsweise könnte es verwendet werden, um Marketingmaterialien zu generieren oder Kundensupportanfragen zu beantworten. Die Fähigkeit von iGent, autonome Multi-Feature-Apps zu entwickeln, ist ebenfalls ein großer Vorteil. Dies bedeutet, dass Entwickler weniger Zeit mit dem Schreiben von Code verbringen und sich stattdessen auf das Design und die Funktionalität von Apps konzentrieren können. Die Tatsache, dass Sourcegraph das Modell als einen großen Sprung in der Softwareentwicklung bezeichnet, ist ein Zeichen für sein Potenzial. Schließlich ist die höhere Erfolgsrate, die chirurgischeren Codebearbeitungen und die sorgfältigeren Arbeiten durch komplexe Aufgaben, die von Augment Code gemeldet werden, ein Beweis für die Zuverlässigkeit und Genauigkeit des Modells.

Erweitertes Denken mit Tool-Nutzung

Sowohl Claude Opus 4 als auch Claude Sonnet 4 verfügen über erweiterte Denkfähigkeiten mit Tool-Nutzung, die es ihnen ermöglichen, externe Tools zu nutzen, um ihre Denk- und Problemlösungsfähigkeiten zu verbessern. Dadurch kann Claude zwischen Denken und Tool-Nutzung wechseln, was zu verbesserten Antworten und genaueren Ergebnissen führt. Die Modelle können auch Tools parallel ausführen, Anweisungen präziser befolgen und deutlich verbesserte Speicherfähigkeiten demonstrieren. Dies wird erreicht, indem wichtige Fakten extrahiert und gespeichert werden, um die Kontinuität aufrechtzuerhalten und im Laufe der Zeit stillschweigendes Wissen aufzubauen.

Die Fähigkeit, externe Tools zu nutzen, erweitert die Fähigkeiten von Claude Opus 4 und Claude Sonnet 4 erheblich. Beispielsweise könnten sie verwendet werden, um auf Daten aus einer Datenbank zuzugreifen, eine Berechnung durchzuführen oder eine E-Mail zu senden. Durch das Wechseln zwischen Denken und Tool-Nutzung können die Modelle komplexe Aufgaben effizienter und genauer bewältigen.

Die Fähigkeit, Tools parallel auszuführen, ist ebenfalls ein großer Vorteil. Dies bedeutet, dass die Modelle mehrere Aufgaben gleichzeitig ausführen können, was die Zeit reduziert, die zum Abschließen eines Projekts benötigt wird. Die verbesserte Speicherfähigkeit der Modelle ermöglicht es ihnen, sich an frühere Interaktionen zu erinnern, was zu kohärenteren und relevanteren Antworten führt. Das Extrahieren und Speichern wichtiger Fakten ermöglicht es den Modellen auch, im Laufe der Zeit stillschweigendes Wissen aufzubauen. Dies bedeutet, dass sie im Laufe der Zeit immer besser darin werden können, Aufgaben zu erledigen.

Claude Code: Jetzt allgemein verfügbar

Claude Code, das jetzt allgemein verfügbar ist, bietet Entwicklern erweiterte Möglichkeiten zur Zusammenarbeit mit Claude. Es unterstützt Hintergrundaufgaben über GitHub Actions und native Integrationen mit VS Code und JetBrains. Bearbeitungen werden direkt in Ihren Dateien angezeigt, was eine nahtlose Paarprogrammierung und kollaborative Entwicklung ermöglicht. Diese Funktion hat während der Forschungsvorschau ein umfassendes positives Feedback erhalten, was ihren Wert bei der Rationalisierung von Entwicklungsworkflows hervorhebt.

Claude Code ist ein kollaboratives Entwicklungswerkzeug, mit dem Entwickler mit Claude zusammenarbeiten können, um Code zu schreiben, zu debuggen und zu überprüfen. Es unterstützt Hintergrundaufgaben über GitHub Actions und native Integrationen mit VS Code und JetBrains. Dies bedeutet, dass Entwickler Claude Code verwenden können, um Aufgaben wie das Erstellen von Tests, das Generieren von Dokumentation und das Refaktorieren von Code zu automatisieren. Bearbeitungen werden direkt in Ihren Dateien angezeigt, was eine nahtlose Paarprogrammierung und kollaborative Entwicklung ermöglicht. Dies bedeutet, dass Entwickler und Claude gemeinsam am selben Code arbeiten können, wobei beide die Änderungen des anderen in Echtzeit sehen können.

Das umfassende positive Feedback, das Claude Code während der Forschungsvorschau erhalten hat, ist ein Beweis für seinen Wert bei der Rationalisierung von Entwicklungsworkflows. Entwickler haben berichtet, dass Claude Code ihnen hilft, Zeit zu sparen, Fehler zu reduzieren und die Codequalität zu verbessern.

Neue API-Funktionen

Anthropic hat außerdem vier neue Funktionen in der Anthropic API veröffentlicht, die es Entwicklern ermöglichen, leistungsfähigere KI-Agenten zu erstellen. Zu diesen Funktionen gehören:

  • Code Execution Tool: Ermöglicht es Agenten, Code-Snippets auszuführen, um komplexe Probleme zu lösen.
  • MCP Connector: Ermöglicht es Agenten, mit externen Datenquellen und Diensten zu interagieren.
  • Files API: Bietet Agenten Zugriff auf lokale Dateisysteme für eine verbesserte Datenverarbeitung.
  • Prompt Caching: Ermöglicht es Entwicklern, Prompts bis zu einer Stunde zu cachen, wodurch die Latenz reduziert und die Leistung verbessert wird.

Das Code Execution Tool ist ein leistungsstarkes Werkzeug, mit dem KI-Agenten Code ausführen können, um komplexe Probleme zu lösen. Beispielsweise könnte ein KI-Agent das Code Execution Tool verwenden, um eine mathematische Gleichung zu lösen, ein Bild von einer Website herunterzuladen oder eine E-Mail zu senden.

Der MCP Connector ist ein Werkzeug, mit dem KI-Agenten mit externen Datenquellen und Diensten interagieren können. Beispielsweise könnte ein KI-Agent den MCP Connector verwenden, um auf Daten aus einer Datenbank zuzugreifen, ein Produkt bei Amazon zu bestellen oder einen Flug zu buchen.

Das Files API ist ein Werkzeug, das KI-Agenten Zugriff auf lokale Dateisysteme für eine verbesserte Datenverarbeitung bietet. Beispielsweise könnte ein KI-Agent das Files API verwenden, um eine Datei von der Festplatte zu lesen, eine Datei auf der Festplatte zu speichern oder eine Datei auf der Festplatte zu löschen.

Das Prompt Caching ist ein Werkzeug, mit dem Entwickler Prompts bis zu einer Stunde cachen können, wodurch die Latenz reduziert und die Leistung verbessert wird. Dies ist besonders nützlich für KI-Agenten, die die gleichen Prompts wiederholt verwenden.

Hybridmodelle mit Dual-Modi

Claude Opus 4 und Sonnet 4 sind Hybridmodelle, die zwei verschiedene Modi bieten:

  • Nahezu sofortige Antworten: Bietet schnelle und effiziente Antworten für Routineabfragen.
  • Erweitertes Denken: Ermöglicht tieferes Denken und Problemlösen für komplexe Aufgaben.

Die Pro-, Max-, Team- und Enterprise-Claude-Pläne umfassen sowohl Modelle als auch erweiterte Denkfähigkeiten. Claude Sonnet 4 ist auch für kostenlose Benutzer zugänglich. Beide Modelle sind auf der Anthropic API, Amazon Bedrock und Googles Vertex AI verfügbar, was eine breite Zugänglichkeit für Entwickler und Organisationen gewährleistet.

Die Hybridarchitektur von Claude Opus 4 und Sonnet 4 ermöglicht es ihnen, sowohl schnelle als auch effiziente Antworten für Routineabfragen als auch tieferes Denken und Problemlösen für komplexe Aufgaben zu bieten. Dies macht sie zu idealen Modellen für eine breite Palette von Anwendungsfällen. Die Tatsache, dass sowohl Modelle als auch erweiterte Denkfähigkeiten in den Pro-, Max-, Team- und Enterprise-Claude-Plänen enthalten sind, bedeutet, dass Unternehmen aller Größenordnungen von diesen Modellen profitieren können. Darüber hinaus gewährleistet die Tatsache, dass Claude Sonnet 4 auch für kostenlose Benutzer zugänglich ist, dass jeder KI nutzen kann. Die breite Verfügbarkeit der Modelle auf der Anthropic API, Amazon Bedrock und Googles Vertex AI macht sie für Entwickler und Organisationen auf der ganzen Welt zugänglich.

Preiskonsistenz

Die Preise für Claude Opus 4 und Sonnet 4 bleiben konsistent mit den vorherigen Opus- und Sonnet-Modellen:

  • Opus 4: 15 $/75 $ pro Million Tokens (Eingabe/Ausgabe)
  • Sonnet 4: 3 $/15 $ pro Million Tokens (Eingabe/Ausgabe)

Die konsistenten Preise für Claude Opus 4 und Sonnet 4 machen sie zu einer erschwinglichen Option für Unternehmen jeder Größe. Die Preise basieren auf der Anzahl der verwendeten Tokens, sodass Entwickler nur für das bezahlen, was sie verwenden. Dies macht es einfach, die Kosten für die Verwendung der Modelle zu budgetieren.

Modellverbesserungen: Reduzierte Abkürzungen und verbesserter Speicher

Zusätzlich zum erweiterten Denken mit Tool-Nutzung, der parallelen Tool-Ausführung und den Speicherverbesserungen hat Anthropic das Auftreten von Modellen, die Abkürzungen oder Schlupflöcher verwenden, um Aufgaben zu erledigen, deutlich reduziert. Beide Modelle neigen zu 65 % weniger zu diesem Verhalten als Sonnet 3.7 bei agentischen Aufgaben. Claude Opus 4 übertrifft auch alle vorherigen Modelle in Bezug auf die Speicherfähigkeiten deutlich. Wenn Entwickler Anwendungen erstellen, die Claude einen lokalen Dateizugriff ermöglichen, zeichnet sich Opus 4 dadurch aus, "Speicherdateien" zu erstellen und zu pflegen, um wichtige Informationen zu speichern. Dies ermöglicht eine bessere langfristige Aufgabenwahrnehmung, Kohärenz und Leistung bei Agentenaufgaben und ermöglicht Szenarien, in denen Opus 4 beispielsweise eine "Navigationsanleitung" erstellt, während Pokémon