Anthropic наскоро пусна своите AI модели от следващо поколение, Claude Opus 4 и Claude Sonnet 4, установявайки нови стандарти в кодиране, разширено разсъждение и AI агентски възможности. Тези модели представляват значителен скок напред, предлагайки подобрена производителност и прецизност за широк спектър от сложни задачи.
Claude Opus 4: Водещият в света модел за кодиране
Claude Opus 4 се откроява като най-добрият модел за кодиране в света, демонстрирайки изключителна и последователна производителност при сложни, дълготрайни задачи. Способността му да се справя с продължително мислене и агентски работни процеси го прави безценен актив за разработчиците, справящи се със сложни предизвикателства при кодирането. Мощта на този модел се простира до разбирането на сложни кодови бази, извършването на прецизни промени в множество файлове и повишаването на качеството на кода по време на редактиране и отстраняване на грешки. Няколко лидери в индустрията похвалиха Claude Opus 4 за неговите възможности:
- Cursor: Го хвали като най-съвременен за кодиране и значителен напредък в разбирането на сложни кодови бази.
- Replit: Подчертава подобрената му прецизност и съществените подобрения за сложни промени в множество файлове.
- Block: Разпознава го като първия модел, който подобрява качеството на кода по време на редактиране и отстраняване на грешки в рамките на неговия агент, с кодово име „goose“, като същевременно поддържа върхова производителност и надеждност.
- Rakuten: Потвърди възможностите му с взискателен рефакторинг на отворен код, който се изпълняваше независимо в продължение на 7 часа с постоянна производителност.
- Cognition: Признава, че Opus 4 превъзхожда в разрешаването на сложни предизвикателства, с които други модели се борят, успешно справяйки се с критични действия, които предишните модели са пропуснали.
Claude Sonnet 4: Значително надграждане
Claude Sonnet 4 представлява значително надграждане от своя предшественик, Claude Sonnet 3.7. Той предоставя превъзходни способности за кодиране и разсъждение, като същевременно реагира по-точно на инструкциите на потребителя. Този модел постига оптимален баланс между производителност и ефективност, което го прави подходящ за широк спектър от вътрешни и външни случаи на употреба. Въпреки че може да не надмине Opus 4 във всички области, той предлага идеална комбинация от възможности и практичност. Основните акценти на Claude Sonnet 4 включват:
- GitHub: Заявява, че Claude Sonnet 4 превъзхожда агентски сценарии и ще бъде интегриран като модел, захранващ новия агент за кодиране в GitHub Copilot.
- Manus: Подчертава подобренията в следването на сложни инструкции, ясно разсъждение и естетически приятни изходи.
- iGent: Съобщава, че Sonnet 4 превъзхожда автономното развитие на приложения с множество функции, както и значително подобрено решаване на проблеми и навигация в кодовата база, намалявайки грешките в навигацията от 20% до почти нула.
- Sourcegraph: Предполага, че моделът показва обещание като значителен скок в разработката на софтуер, поддържайки фокус за по-дълги периоди, разбирайки проблемите по-дълбоко и осигурявайки по-елегантно качество на кода.
- Augment Code: Отчита по-високи нива на успеваемост, по-хирургични редакции на кода и по-внимателна работа чрез сложни задачи, което го прави най-добрият избор за техния основен модел.
Разширено мислене с използване на инструменти
И Claude Opus 4, и Claude Sonnet 4 разполагат с разширени възможности за мислене с използване на инструменти, което им позволява да използват външни инструменти, за да подобрят своите способности за разсъждение и решаване на проблеми. Това позволява на Claude да се редува между разсъждение и използване на инструменти, което води до подобрени отговори и по-точни резултати. Моделите могат също така да изпълняват инструменти паралелно, да следват инструкции с по-голяма прецизност и да демонстрират значително подобрени възможности за запазване на паметта. Това сепостига чрез извличане и запазване на ключови факти за поддържане на приемственост и изграждане на мълчаливо знание с течение на времето.
Claude Code: Вече общодостъпен
Claude Code, вече общодостъпен, предоставя на разработчиците разширени възможности да си сътрудничат с Claude. Той поддържа фонови задачи чрез GitHub Actions и собствени интеграции с VS Code и JetBrains. Редактите се показват директно във вашите файлове, улеснявайки безпроблемното програмиране по двойки и съвместната разработка. Тази функция получи широка положителна обратна връзка по време на прегледа на изследването, подчертавайки нейната стойност в рационализирането на работните процеси за разработка.
Нови API възможности
Anthropic също така пусна четири нови възможности на Anthropic API, давайки възможност на разработчиците да конструират по-мощни AI агенти. Тези възможности включват:
- Инструмент за изпълнение на код: Позволява на агентите да изпълняват фрагменти от код за решаване на сложни проблеми.
- MCP конектор: Позволява на агентите да взаимодействат с външни източници на данни и услуги.
- API за файлове: Предоставя на агентите достъп до локални файлови системи за подобрена обработка на данни.
- Кеширане на подкани: Позволява на разработчиците да кешират подкани за до един час, намалявайки латентността и подобрявайки производителността.
Хибридни модели с двойни режими
Claude Opus 4 и Sonnet 4 са хибридни модели, които предлагат два различни режима:
- Почти мигновени отговори: Осигурява бързи и ефективни отговори за рутинни заявки.
- Разширено мислене: Позволява по-дълбоко разсъждение и решаване на проблеми за сложни задачи.
Pro, Max, Team и Enterprise Claude плановете включват както модели, така и разширени възможности за мислене. Claude Sonnet 4 е достъпен и за безплатни потребители. И двата модела са налични на Anthropic API, Amazon Bedrock и Google Cloud’s Vertex AI, осигурявайки широка достъпност за разработчици и организации.
Последователност на цените
Цените за Claude Opus 4 и Sonnet 4 остават последователни с предишните модели Opus и Sonnet:
- Opus 4: $15/$75 на милион токени (вход/изход)
- Sonnet 4: $3/$15 на милион токени (вход/изход)
Подобрения на модела: Намалени преки пътища и подобрена памет
В допълнение към разширеното мислене с използване на инструменти, паралелно изпълнение на инструменти и подобрения на паметта, Anthropic значително намали появата на модели, използващи преки пътища или вратички за извършване на задачи. И двата модела са с 65% по-малко склонни да се занимат с такова поведение в сравнение със Sonnet 3.7 при агентски задачи. Claude Opus 4 също така значително превъзхожда всички предишни модели по отношение на възможностите за запазване на паметта. Когато програмистите изграждат приложения, които осигуряват на Claude локален достъп до файлове, Opus 4 превъзхожда създаването и поддържането на „файлове с памет“ за съхранение на ключова информация. Това отключва по-добра дългосрочна осведоменост за задачите, последователност и производителност при агентски задачи, позволявайки сценарии като Opus 4, създаващ „Ръководство за навигация“, докато играе Pokémon.
Обобщения на мисленето
Anthropic въведе обобщения на мисленето за моделите Claude 4, които използват по-малък модел, за да кондензират дълги мисловни процеси. Тази функция се използва само приблизително 5% от времето, тъй като повечето мисловни процеси са достатъчно кратки, за да бъдат показани изцяло. Потребителите, нуждаещи се отсурови вериги от мисли за усъвършенствано инженерство на подкани, могат да се свържат с отдела по продажбите относно Anthropic новия режим за разработчици, за да запазят пълен достъп.
Интеграция на Claude Code
Claude Code вече е интегриран в повече от вашия работен процес за разработка, включително терминала, предпочитаните от вас IDE и фоновото изпълнение с Claude Code SDK. Нови бета разширения за VS Code и JetBrains безпроблемно интегрират Claude Code директно във вашата IDE. Предложените редакции на Claude се появяват вградени във вашите файлове, рационализиране на прегледа и проследяване в рамките на познатия интерфейс на редактора. За да инсталирате, просто изпълнете Claude Code във вашия IDE терминал.
Разширяем Claude Code SDK
Освен IDE, Anthropic пуска разширяем Claude Code SDK, позволяващ на потребителите да изграждат свои собствени агенти и приложения, използвайки същия основен агент като Claude Code. Пример за това какво е възможно с SDK е Claude Code на GitHub, вече в бета версия. Маркирайте Claude Code на PR, за да отговорите на обратната връзка от рецензентите, да отстраните CI грешки или да промените код. За да инсталирате, изпълнете /install-github-app от Claude Code.
Стъпка към виртуално сътрудничество
Тези модели представляват значителна крачка към виртуалния сътрудник, поддържайки пълния контекст, поддържайки фокус върху по-дълги проекти и предизвиквайки трансформиращо въздействие. Те преминават през обширни тестове и оценки, за да се сведе до минимум рискът и да се увеличи максимално безопасността, включително прилагането на мерки за по-високи нива на AI безопасност като ASL-3.
Тези постижения обещават вълнуващи възможности за разнообразни приложения, като Opus 4 пробива границите в кодирането, научните изследвания, писането и научните открития, а Sonnet 4 носи гранична производителност към ежедневните случаи на употреба като незабавно надграждане от Sonnet 3.7.