Claude 3.7 Sonnet: новый эталон в области кодирования
Недавний выпуск Claude 3.7 Sonnet, всего две недели назад, служит убедительным доказательством. Эта последняя итерация побила существующие рекорды производительности кодирования. Одновременно Anthropic представила Claude Code, AI-агент командной строки, предназначенный для ускорения разработки приложений для программистов. В дополнение к этому, Cursor, редактор кода с AI, который по умолчанию использует модель Claude от Anthropic, по сообщениям, взлетел до впечатляющих 100 миллионов долларов годового дохода всего за 12 месяцев.
Преднамеренный акцент Anthropic на кодировании совпадает с растущим признанием среди предприятий преобразующего потенциала AI-агентов кодирования. Эти агенты позволяют как опытным разработчикам, так и людям, не имеющим опыта кодирования, создавать приложения с беспрецедентной скоростью и эффективностью. Как метко выразился Гильермо Раух, генеральный директор Vercel, быстрорастущей компании, позволяющей разработчикам (включая тех, кто не занимается кодированием) развертывать интерфейсные приложения: ‘Anthropic продолжает выходить на первое место’. Решение Vercel в прошлом году переключить свою основную модель кодирования с GPT от OpenAI на Claude от Anthropic после тщательной оценки их производительности в решении важнейших задач кодирования подчеркивает этот момент.
Claude 3.7 Sonnet, запущенный 24 февраля, продемонстрировал лидерство практически во всех тестах кодирования. Он достиг замечательных 70,3% в высоко ценимом тесте SWE-bench, измеряющем возможности агента по разработке программного обеспечения. Этот показатель значительно превосходит показатели его ближайших конкурентов, o1 от OpenAI (48,9%) и DeepSeek-R1 (49,2%). Кроме того, Claude 3.7 демонстрирует превосходную производительность в задачах, связанных с агентами.
Эти результаты тестов были быстро подтверждены сообществами разработчиков посредством реальных испытаний. В онлайн-дискуссиях, особенно на таких платформах, как Reddit, сравнивающих Claude 3.7 с Grok 3 (последней моделью xAI Илона Маска), неизменно отдается предпочтение модели Anthropic для задач кодирования. Один из лучших комментаторов резюмировал настроения: ‘Основываясь на том, что я тестировал, Claude 3.7 кажется лучшим для написания кода (по крайней мере, для меня)’. Очень важно отметить, что даже Manus, новый китайский многоцелевой агент, который произвел фурор в начале этой недели, заявил, что он лучше, чем Deep Research от Open AI и другие автономные задачи, был в значительной степени построен на Claude.
Стратегический фокус: корпоративная игра Anthropic
Непоколебимая ориентация Anthropic на возможности кодирования далеко не случайна. Просочившиеся прогнозы, о которых сообщает The Information, предполагают, что Anthropic стремится к ошеломляющим 34,5 миллиардам долларов дохода к 2027 году. Это представляет собой 86-кратное увеличение по сравнению с текущими уровнями. Ожидается, что значительная часть (примерно 67%) этого прогнозируемого дохода будет поступать от API-бизнеса, причем корпоративные приложения для кодирования будут служить основным двигателем роста. Хотя Anthropic не раскрывает точных цифр доходов, компания сообщила о замечательном 1000%-ном росте доходов от кодирования в последнем квартале 2024 года. В дополнение к этому финансовому импульсу Anthropic недавно объявила о раунде финансирования в размере 3,5 миллиардов долларов, оценив компанию в впечатляющие 61,5 миллиарда долларов.
Эта стратегия, ориентированная на кодирование, согласуется с выводами собственного экономического индекса Anthropic. Индекс показал, что значительные 37,2% запросов, направленных к Claude, относятся к категории ‘компьютерные и математические’. Эти запросы в первую очередь охватывали задачи разработки программного обеспечения, такие как модификация кода, отладка и устранение неполадок в сети.
Подход Anthropic выделяется на фоне конкурентной среды, где соперники часто оказываются в вихре активности, пытаясь удовлетворить потребности как корпоративного, так и потребительского рынков с помощью широкого спектра функций. OpenAI, сохраняя сильное лидерство благодаря своему раннему признанию и принятию потребителями, сталкивается с проблемой обслуживания как обычных пользователей, так и предприятий с помощью разнообразного набора моделей и функций. Google, аналогичным образом, придерживается стратегии предложения широкого ассортимента продуктов.
Сравнительно дисциплинированный подход Anthropic также отражается в его продуктовых решениях. Вместо того, чтобы гнаться за долей потребительского рынка, компания отдала приоритет функциям корпоративного уровня, таким как интеграция с GitHub, журналы аудита, настраиваемые разрешения и средства управления безопасностью, специфичные для домена. Шесть месяцев назад компания представила огромное контекстное окно на 500 000 токенов для разработчиков, что резко контрастирует с решением Google ограничить свое окно на 1 миллион токенов частными тестировщиками. Этот стратегический фокус привел к созданию комплексного предложения, ориентированного на кодирование, которое все больше находит отклик у предприятий.
Недавнее введение компанией функций, позволяющих людям, не являющимся программистами, публиковать приложения, сгенерированные AI, в своих организациях, в сочетании с обновлением консоли на прошлой неделе, включающим расширенные возможности совместной работы (включая общие подсказки и шаблоны), еще больше иллюстрирует эту тенденцию. Эта демократизация отражает стратегию ‘Троянского коня’: сначала предоставить разработчикам возможность создавать прочные основы, а затем расширить доступ к более широкому кругу сотрудников предприятия, в конечном итоге достигнув корпоративного руководства.
Практический опыт работы с Claude: практический эксперимент
Чтобы оценить реальные возможности этих агентов кодирования, был проведен практический эксперимент, посвященный созданию базы данных для хранения статей. Были использованы три различных подхода: Claude 3.7 Sonnet через приложение Anthropic, агент кодирования Cursor и Claude Code.
При использовании Claude 3.7 непосредственно через приложение Anthropic предоставленные рекомендации были удивительно проницательными, особенно для человека, не имеющего большого опыта кодирования. Модель представила несколько вариантов, начиная от надежных решений, использующих базы данных PostgreSQL, и заканчивая более легкими альтернативами, такими как Airtable. Выбрав облегченное решение, Claude методично руководил процессом извлечения статей из API и их интеграции в Airtable с помощью службы-коннектора. Хотя процесс занял около двух часов, в основном из-за проблем с аутентификацией, он завершился созданием функциональной системы. По сути, вместо того, чтобы автономно писать весь код, Claude предоставил исчерпывающий план достижения желаемого результата.
Cursor, с его стандартной зависимостью от моделей Claude, представил полноценный опыт редактора кода и продемонстрировал большую склонность к автоматизации. Однако он требовал разрешения на каждом шаге, что приводило к несколько итеративному рабочему процессу.
Claude Code предложил другой подход, работая непосредственно в терминале и используя SQLite для создания локальной базы данных, заполненной статьями из RSS-канала. Это решение оказалось более простым и надежным в достижении конечной цели, хотя и менее надежным и многофункциональным по сравнению с реализацией Airtable. Это подчеркивает присущие компромиссы и важность выбора агента кодирования в зависимости от конкретных требований проекта.
Ключевой вывод из этого эксперимента заключается в том, что даже не будучи разработчиком, можно было создавать функциональные приложения баз данных, используя все три подхода. Это было бы практически невообразимо всего год назад. И, что примечательно, все три подхода опирались на базовые возможности Claude.
Экосистема агентов кодирования: Cursor и не только
Пожалуй, самым убедительным показателем успеха Anthropic является феноменальный рост Cursor, редактора кода с AI. Отчеты показывают, что Cursor собрал 360 000 пользователей, причем более 40 000 из них являются платными клиентами, всего за 12 месяцев. Эта траектория быстрого роста потенциально позиционирует Cursor как самую быстрорастущую SaaS-компанию, достигшую этой вехи.
Успех Cursor неразрывно связан с Claude. Как заметил Сэм Виттевин, соучредитель Red Dragon (независимого разработчика AI-агентов): ‘Вы должны думать, что их клиент номер один — это Cursor. Большинство людей в [Cursor] уже использовали модель Claude Sonnet — модели 3.5. И теперь кажется, что все просто переходят на 3.7’.
Отношения между Anthropic и его экосистемой выходят за рамки отдельных компаний, таких как Cursor. В ноябре Anthropic представила свой Model Context Protocol (MCP) в качестве открытого стандарта, позволяющего разработчикам создавать инструменты, которые беспрепятственно взаимодействуют с моделями Claude. Этот стандарт получил широкое распространение в сообществе разработчиков.
Виттевин объяснил значение этого подхода: ‘Запуская это как открытый протокол, они как бы говорят: ‘Эй, все, дерзайте. Вы можете разрабатывать все, что соответствует этому протоколу. Мы собираемся поддерживать этот протокол’’.
Эта стратегия создает добродетельный цикл: разработчики создают инструменты специально для Claude, повышая его ценностное предложение для предприятий, что, в свою очередь, стимулирует дальнейшее внедрение и привлекает больше разработчиков.
Конкурентная среда: Microsoft, OpenAI, Google и Open Source
В то время как Anthropic заняла нишу благодаря своему целенаправленному подходу, конкуренты придерживаются различных стратегий с разной степенью успеха.
Microsoft сохраняет прочные позиции благодаря своему GitHub Copilot, который может похвастаться 1,3 миллионами платных пользователей и внедрением более чем в 77 000 организаций примерно за два года. Среди его пользователей такие известные компании, как Honeywell, State Street, TD Bank Group и Levi’s. Это широкое распространение во многом объясняется существующими корпоративными отношениями Microsoft и ее преимуществом первопроходца, обусловленным ее ранними инвестициями в OpenAI и использованием моделей OpenAI для поддержки Copilot.
Однако даже Microsoft признала сильные стороны Anthropic. В октябре компания позволила пользователям GitHub Copilot выбирать модели Anthropic в качестве альтернативы предложениям OpenAI. Кроме того, недавние модели OpenAI, o1 и более новая o3 (которые делают акцент на рассуждениях посредством расширенного мышления), не продемонстрировали особых преимуществ в кодировании или задачах, связанных с агентами.
Google сделала свой собственный ход, недавно предложив свой Code Assist бесплатно, но это больше похоже на оборонительный маневр, а не на стратегическую инициативу.
Движение open-source представляет собой еще одну значительную силу в этой области. Модели Llama от Meta получили значительную поддержку предприятий: крупные компании, такие как AT&T, DoorDash и Goldman Sachs, развертывают модели на основе Llama для различных приложений. Подход open-source предоставляет предприятиям больший контроль, возможности настройки и экономические выгоды, которые закрытые модели часто не могут обеспечить.
Вместо того, чтобы рассматривать это как прямую угрозу, Anthropic, похоже, позиционирует себя как дополнение к open source. Корпоративные клиенты могут использовать Claude в сочетании с моделями с открытым исходным кодом в зависимости от своих конкретных требований, применяя гибридный подход, который максимизирует сильные стороны каждого из них.
Фактически, многие крупные корпоративные компании внедрили мультимодальный подход, используя ту модель, которая лучше всего подходит для данной задачи. Intuit, например, первоначально полагалась на OpenAI в качестве стандартного решения для своих приложений для налоговых деклараций, но впоследствии перешла на Claude из-за его превосходной производительности в определенных сценариях. Этот опыт побудил Intuit разработать платформу оркестровки AI, которая облегчила плавное переключение между моделями.
Большинство других корпоративных компаний с тех пор внедрили аналогичную практику, используя наиболее подходящую модель для каждого конкретного случая использования, часто интегрируя модели с помощью простых вызовов API. Хотя модель с открытым исходным кодом, такая как Llama, может быть подходящей в некоторых случаях, Claude часто является предпочтительным выбором для задач, требующих высокой точности, таких как вычисления.
Последствия для предприятий: навигация по переходу к агентам кодирования
Для лиц, принимающих решения на предприятии, эта быстро развивающаяся среда предоставляет как возможности, так и проблемы.
Безопасность остается первостепенной проблемой, но недавний независимый отчет определил Claude 3.7 Sonnet как самую безопасную модель на сегодняшний день, единственную протестированную, которая оказалась ‘защищенной от взлома’. Эта позиция в области безопасности в сочетании с поддержкой Anthropic со стороны Google и Amazon (и интеграцией в AWS Bedrock) выгодно позиционирует ее для внедрения на предприятиях.
Распространение агентов кодирования не просто меняет способ разработки приложений; это демократизирует процесс. По данным GitHub, значительные 92% разработчиков из США в корпоративных компаниях уже использовали инструменты кодирования на базе AI на работе 18 месяцев назад. Эта цифра, вероятно, значительно увеличилась с тех пор.
Виттевин подчеркнул преодоление разрыва между техническими и нетехническими членами команды: ‘Проблема, с которой сталкиваются люди [из-за того, что] они не являются программистами, на самом деле заключается в том, что они не знают многих терминов. Они не знают лучших практик’. AI-агенты кодирования все чаще решают эту проблему, обеспечивая более эффективное сотрудничество.
Для внедрения на предприятии Виттевин выступает за сбалансированный подход: ‘На данный момент это баланс между безопасностью и экспериментами. Очевидно, что со стороны разработчиков люди начинают создавать реальные приложения с помощью этих вещей’.
Появление AI-агентов кодирования означает фундаментальный сдвиг в разработке корпоративного программного обеспечения. При эффективном развертывании эти инструменты не вытесняют разработчиков, а скорее трансформируют их роли, позволяя им сосредоточиться на архитектуре и инновациях, а не на деталях реализации.
Дисциплинированный подход Anthropic, ориентированный конкретно на возможности кодирования, в то время как конкуренты преследуют множество приоритетов, похоже, дает значительные преимущества. К концу 2025 года этот период может быть ретроспективно рассмотрен как поворотный момент, когда AI-агенты кодирования стали незаменимыми корпоративными инструментами, а Claude возглавил этот процесс.
Для лиц, принимающихтехнические решения, императив ясен: незамедлительно начать экспериментировать с этими инструментами или рисковать отстать от конкурентов, которые уже используют их для резкого ускорения циклов разработки. Эта ситуация напоминает первые дни революции iPhone, когда компании первоначально пытались ограничить использование ‘несанкционированных’ устройств в своих корпоративных сетях, но в конечном итоге приняли политику BYOD, поскольку спрос со стороны сотрудников стал подавляющим. Некоторые компании, такие как Honeywell, недавно аналогичным образом пытались прекратить ‘несанкционированное’ использование инструментов кодирования с AI, не одобренных ИТ-отделом.
Умные компании уже создают безопасные среды ‘песочницы’ для облегчения контролируемых экспериментов. Организации, которые устанавливают четкие ограничения, одновременно поощряя инновации, получат выгоду как от энтузиазма сотрудников, так и от понимания того, как эти инструменты могут наилучшим образом удовлетворить их уникальные потребности, опережая конкурентов, которые сопротивляются изменениям. И Claude от Anthropic, по крайней мере, на данный момент, является главным бенефициаром этого преобразующего движения.