Claude 4: Новая Эра ИИ Превосходства

Anthropic недавно представила свои модели ИИ нового поколения - Claude Opus 4 и Claude Sonnet 4, установив новые ориентиры в области кодирования, продвинутых рассуждений и возможностей агентов ИИ. Эти модели представляют собой значительный шаг вперед, предлагая повышенную производительность и точность для широкого спектра сложных задач.

Claude Opus 4: Лучшая в мире модель для кодирования

Claude Opus 4 выделяется как лучшая в мире модель для кодирования, демонстрируя исключительную и последовательную производительность при выполнении сложных и длительных задач. Ее способность справляться с задачами, требующими длительного обдумывания, и рабочими процессами агентов делает ее бесценным активом для разработчиков, решающих сложные задачи кодирования. Мощь этой модели распространяется на понимание сложных баз кода, внесение точных изменений в несколько файлов и повышение качества кода во время редактирования и отладки. Несколько лидеров отрасли высоко оценили Claude Opus 4 за ее возможности:

  • Cursor: хвалит ее как самую современную для кодирования и значительный шаг вперед в понимании сложных баз кода.
  • Replit: подчеркивает ее улучшенную точность и значительные улучшения для сложных изменений в многочисленных файлах.
  • Block: признает ее первой моделью, которая улучшает качество кода во время редактирования и отладки внутри своего агента, под кодовым названием "goose", сохраняя при этом максимальную производительность и надежность.
  • Rakuten: подтвердил ее возможности с помощью сложной реорганизации открытого исходного кода, которая выполнялась независимо в течение 7 часов с постоянной производительностью.
  • Cognition: признает, что Opus 4 превосходно справляется с решением сложных задач, с которыми другие модели испытывают трудности, успешно обрабатывая критические действия, которые предыдущие модели упустили из виду.

Claude Sonnet 4: Значительное обновление

Claude Sonnet 4 представляет собой существенное обновление по сравнению с ее предшественницей, Claude Sonnet 3.7. Она обеспечивает превосходные возможности кодирования и рассуждений, точнее реагируя на инструкции пользователя. Эта модель обеспечивает оптимальный баланс между производительностью и эффективностью, что делает ее подходящей для широкого спектра внутренних и внешних вариантов использования. Хотя она может и не превзойти Opus 4 во всех областях, она предлагает идеальное сочетание возможностей и практичности. Ключевые особенности Claude Sonnet 4 включают:

  • GitHub: заявляет, что Claude Sonnet 4 превосходно справляется со сценариями агентов и будет интегрирован в качестве модели, поддерживающей нового агента кодирования в GitHub Copilot.
  • Manus: подчеркивает улучшения в следовании сложным инструкциям, четком рассуждении и эстетически приятных результатах.
  • iGent: сообщает, что Sonnet 4 превосходно справляется с автономной разработкой многофункциональных приложений, а также значительно улучшает решение проблем и навигацию по базе кода, снижая количество ошибок навигации с 20% почти до нуля.
  • Sourcegraph: предполагает, что модель подает большие надежды как значительный скачок в разработке программного обеспечения, поддерживая концентрацию внимания в течение более длительных периодов времени, глубже понимая проблемы и обеспечивая более элегантное качество кода.
  • Augment Code: сообщает о более высоких показателях успеха, более точных изменениях кода и более тщательной работе над сложными задачами, что делает ее лучшим выбором для их основной модели.

Расширенное мышление с использованием инструментов

И Claude Opus 4, и Claude Sonnet 4 обладают расширенными возможностями мышления с использованием инструментов, что позволяет им использовать внешние инструменты для повышения своих способностей к рассуждению и решению проблем. Это позволяет Claude чередовать рассуждения и использование инструментов, что приводит к улучшенным ответам и более точным результатам. Модели также могут выполнять инструменты параллельно, следовать инструкциям с большей точностью и демонстрировать значительно улучшенные возможности памяти. Это достигается путем извлечения и сохранения ключевых фактов для поддержания непрерывности и накопления неявных знаний с течением времени.

Claude Code: Теперь общедоступен

Claude Code, теперь общедоступный, предоставляет разработчикам расширенные возможности для сотрудничества с Claude. Он поддерживает фоновые задачи через GitHub Actions и встроенные интеграции с VS Code и JetBrains. Изменения отображаются непосредственно в ваших файлах, что облегчает парное программирование и совместную разработку. Эта функция получила широкие положительные отзывы во время предварительного просмотра исследования, подчеркивая ее ценность в оптимизации рабочих процессов разработки.

Новые возможности API

Anthropic также выпустила четыре новые возможности в Anthropic API, позволяя разработчикам создавать более мощных агентов ИИ. Эти возможности включают в себя:

  • Инструмент выполнения кода: позволяет агентам выполнять фрагменты кода для решения сложных проблем.
  • MCP Connector: позволяет агентам взаимодействовать с внешними источниками данных и службами.
  • Files API: предоставляет агентам доступ к локальным файловым системам для расширенной обработки данных.
  • Prompt Caching: позволяет разработчикам кэшировать промпты на срок до одного часа, снижая задержку и повышая производительность.

Гибридные модели с двойными режимами

Claude Opus 4 и Sonnet 4 - это гибридные модели, которые предлагают два различных режима:

  • Мгновенные ответы: обеспечивает быстрые и эффективные ответы на рутинные запросы.
  • Расширенное мышление: позволяет глубже рассуждать и решать проблемы для сложных задач.

Планы Pro, Max, Team и Enterprise Claude включают обе модели и расширенные возможности мышления. Claude Sonnet 4 также доступен бесплатным пользователям. Обе модели доступны в Anthropic API, Amazon Bedrock и Vertex AI от Google Cloud, что обеспечивает широкий доступ для разработчиков и организаций.

Согласованность цен

Цены на Claude Opus 4 и Sonnet 4 остаются согласованными с предыдущими моделями Opus и Sonnet:

  • Opus 4: $15/$75 за миллион токенов (ввод/вывод)
  • Sonnet 4: $3/$15 за миллион токенов (ввод/вывод)

Улучшения модели: уменьшение количества ярлыков и улучшенная память

В дополнение к расширенному мышлению с использованием инструментов, параллельному выполнению инструментов и улучшениям памяти Anthropic значительно сократила случаи использования моделями ярлыков или лазеек для выполнения задач. Обе модели на 65% менее склонны к такому поведению по сравнению с Sonnet 3.7 при выполнении задач агента. Claude Opus 4 также значительно превосходит все предыдущие модели с точки зрения возможностей памяти. Когда разработчики создают приложения, которые предоставляют Claude доступ к локальным файлам, Opus 4 превосходно создает и поддерживает "файлы памяти" для хранения ключевой информации. Это обеспечивает лучшее долгосрочное осознание задач, согласованность и производительность при выполнении задач агента, что позволяет реализовать такие сценарии, как Opus 4, создающий "Руководство по навигации" во время игры в Pokémon.

Резюме размышлений

Anthropic представила резюме размышлений для моделей Claude 4, в которых используется меньшая модель для сжатия длинных мыслительных процессов. Эта функция используется только примерно в 5% случаев, поскольку большинство мыслительных процессов достаточно короткие, чтобы отображаться полностью. Пользователи, которым требуются необработанные цепочки мыслей для расширенной разработки промптов, могут обратиться в отдел продаж Anthropic по поводу нового режима разработчика Anthropic, чтобы сохранить полный доступ.

Интеграция Claude Code

Claude Code теперь интегрирован в большее количество ваших рабочих процессов разработки, включая терминал, предпочитаемые IDE и фоновое выполнение с помощью Claude Code SDK. Новые бета-версии расширений для VS Code и JetBrains легко интегрируют Claude Code непосредственно в вашу IDE. Предлагаемые Claude изменения отображаются встроенными в ваших файлах, упрощая просмотр и отслеживание в знакомом интерфейсе редактора. Чтобы установить, просто запустите Claude Code в терминале IDE.

Расширяемый Claude Code SDK

Помимо IDE, Anthropic выпускает расширяемый Claude Code SDK, позволяющий пользователям создавать собственных агентов и приложения, используя тот же основной агент, что и Claude Code. Примером того, что возможно с SDK, является бета-версия Claude Code на GitHub. Отметьте Claude Code на PR, чтобы ответить на отзывы рецензентов, исправить ошибки CI или изменить код. Чтобы установить, запустите /install-github-app из Claude Code.

Шаг к виртуальному сотрудничеству

Эти модели представляют собой значительный шаг вперед к виртуальному сотруднику, поддерживающему полный контекст, сохраняющему концентрацию внимания на более длительных проектах и оказывающему преобразующее воздействие. Они проходят обширное тестирование и оценку для минимизации риска и максимизации безопасности, включая реализацию мер для более высоких уровней безопасности ИИ, таких как ASL-3.

Эти достижения обещают захватывающие возможности для различных приложений: Opus 4 расширяет границы в области кодирования, исследований, письма и научных открытий, а Sonnet 4 обеспечивает передовую производительность для повседневных случаев использования в качестве мгновенного обновления по сравнению с Sonnet 3.7.