Тихият преврат на Anthropic | bg

Claude 3.7 Sonnet: Нов еталон в кодирането

Неотдавнашното пускане на Claude 3.7 Sonnet, само преди две седмици, служи като убедително доказателство. Тази последна итерация разби съществуващите рекорди за производителност при кодиране. Едновременно с това, Anthropic представи Claude Code, AI агент от командния ред, предназначен да ускори разработката на приложения за програмисти. В допълнение към този импулс, Cursor, AI-захранван редактор на код, който по подразбиране използва модела Claude на Anthropic, се съобщава, че е достигнал впечатляващите $100 милиона годишни повтарящи се приходи само за 12 месеца.

Умишленият акцент на Anthropic върху кодирането съвпада с нарастващото признание сред предприятията за трансформиращия потенциал на AI кодиращите агенти. Тези агенти дават възможност както на опитни разработчици, така и на лица без опит в кодирането да създават приложения с безпрецедентна скорост и ефективност. Както Гилермо Раух, главен изпълнителен директор на Vercel, бързо разрастваща се компания, която позволява на разработчиците (включително тези, които не са програмисти) да внедряват front-end приложения, уместно заяви: ‘Anthropic продължава да излиза на върха.’ Решението на Vercel миналата година да превключи основния си модел за кодиране от GPT на OpenAI към Claude на Anthropic, след задълбочена оценка на тяхната производителност при решаващи задачи за кодиране, подчертава тази точка.

Claude 3.7 Sonnet, пуснат на 24 февруари, доказано е поел водеща роля в почти всички бенчмаркове за кодиране. Той постигна забележителните 70,3% на високо ценения SWE-bench бенчмарк, мярка за възможностите на агента за разработка на софтуер. Този резултат значително надминава тези на най-близките му конкуренти, o1 на OpenAI (48,9%) и DeepSeek-R1 (49,2%). Освен това, Claude 3.7 показва превъзходна производителност при агентни задачи.

Тези резултати от бенчмарковете бяха бързо потвърдени от общностите на разработчиците чрез тестове в реалния свят. Онлайн дискусиите, особено на платформи като Reddit, сравняващи Claude 3.7 с Grok 3 (най-новият модел от xAI на Илон Мъск), последователно предпочитат модела на Anthropic за задачи за кодиране. Един от най-добрите коментатори обобщи настроението: ‘Въз основа на това, което тествах, Claude 3.7 изглежда е най-добрият за писане на код (поне за мен).’ Много е важно да се отбележи, че дори Manus, новият китайски многофункционален агент, който превзе света по-рано тази седмица, заявявайки, че е по-добър от Deep Research на Open AI и други автономни задачи, е изграден до голяма степен върху Claude.

Стратегически фокус: Предприятието на Anthropic

Непоколебимият фокус на Anthropic върху възможностите за кодиране далеч не е случаен. Изтекли прогнози, докладвани от The Information, предполагат, че Anthropic се стреми към зашеметяващите $34,5 милиарда приходи до 2027 г. Това представлява 86-кратно увеличение спрямо сегашните му нива. Очаква се значителна част (приблизително 67%) от тези прогнозирани приходи да произтичат от API бизнеса, като приложенията за кодиране на предприятия служат като основен двигател на растежа. Въпреки че Anthropic не е разкрил точни данни за приходите, той е отчел забележителен скок от 1000% в приходите от кодиране през последното тримесечие на 2024 г. В допълнение към този финансов импулс, Anthropic наскоро обяви кръг на финансиране от $3,5 милиарда, оценявайки компанията на впечатляващите $61,5 милиарда.

Тази кодинг-центрична стратегия е в съответствие с констатациите на собствения икономически индекс на Anthropic. Индексът разкри, че значителните 37,2% от заявките, насочени към Claude, попадат в категорията ‘компютърни и математически’. Тези заявки обхващат предимно задачи по софтуерно инженерство като модификация на код, отстраняване на грешки и отстраняване на проблеми в мрежата.

Подходът на Anthropic се откроява сред конкурентния пейзаж, където съперниците често са хванати във вихър от дейности, опитвайки се да се погрижат както за корпоративните, така и за потребителските пазари с широк спектър от функции. OpenAI, макар и да поддържа силна преднина поради ранното си потребителско разпознаване и приемане, е изправен пред предизвикателството да обслужва както обикновени потребители, така и фирми с разнообразен набор от модели и функционалности. Google, по подобен начин, следва стратегия за предлагане на широкообхватно продуктово портфолио.

Сравнително дисциплинираният подход на Anthropic се отразява и в продуктовите му решения. Вместо да преследва пазарен дял на потребителите, компанията е дала приоритет на функции от корпоративен клас като GitHub интеграция, одитни дневници, персонализируеми разрешения и специфични за домейна контроли за сигурност. Преди шест месеца той представи огромен контекстен прозорец от 500 000 токена за разработчици, рязък контраст с решението на Google да ограничи своя прозорец от 1 милион токена до частни тестери. Този стратегически фокус доведе до цялостно, кодинг-центрично предложение, което все повече резонира с предприятията.

Неотдавнашното въвеждане на функции, позволяващи на непрограмисти да публикуват AI-генерирани приложения в рамките на своите организации, съчетано с миналата седмица надграждане на конзолата с подобрени възможности за сътрудничество (включително споделяеми подкани и шаблони), допълнително илюстрира тази тенденция. Тази демократизация отразява стратегията ‘Троянски кон’: първоначално овластяване на разработчиците да изградят здрави основи, последвано от разширяване на достъпа до по-широката корпоративна работна сила, в крайна сметка достигайки до корпоративния апартамент.

Практически опит с Claude: Практически експеримент

За да се оценят реалните възможности на тези кодиращи агенти, беше проведен практически експеримент, фокусиран върху изграждането на база данни за съхранение на статии. Бяха използвани три различни подхода: Claude 3.7 Sonnet чрез приложението на Anthropic, кодиращият агент на Cursor и Claude Code.

Използвайки Claude 3.7 директно чрез приложението на Anthropic, предоставените насоки бяха забележително проницателни, особено за някой без богат опит в кодирането. Моделът представи няколко опции, вариращи от надеждни решения, използващи PostgreSQL бази данни, до по-леки алтернативи като Airtable. Избирайки лекото решение, Claude методично ръководи процеса на извличане на статии от API и интегрирането им в Airtable с помощта на услуга за конектор. Въпреки че процесът отне приблизително два часа, главно поради предизвикателствата при удостоверяването, той завърши с функционална система. По същество, вместо автономно да пише целия код, Claude предостави изчерпателен план за постигане на желания резултат.

Cursor, с подразбиращото се разчитане на моделите на Claude, представи пълноценно изживяване с редактор на код и показа по-голяма склонност към автоматизация. Въпреки това, той изискваше разрешение на всяка стъпка, което доведе до донякъде итеративен работен процес.

Claude Code предложи различен подход, работещ директно в терминала и използващ SQLite за създаване на локална база данни, попълнена със статии от RSS емисия. Това решение се оказа по-просто и по-надеждно за постигане на крайната цел, макар и по-малко надеждно и богато на функции в сравнение с внедряването на Airtable. Това подчертава присъщите компромиси и подчертава важността на избора на кодиращ агент въз основа на специфичните изисквания на проекта.

Ключовият извод от този експеримент е, че дори като непрограмист, беше възможно да се изградят функционални приложения за бази данни, използвайки и трите подхода. Това би било практически немислимо само преди година. И, забележително, и трите подхода разчитаха на основните възможности на Claude.

Екосистемата на кодиращите агенти: Cursor и отвъд

Може би най-убедителният индикатор за успеха на Anthropic е феноменалният растеж на Cursor, AI редактор на код. Докладите сочат, че Cursor е натрупал 360 000 потребители, като над 40 000 от тях са плащащи клиенти, само за 12 месеца. Тази бърза траектория на растеж потенциално позиционира Cursor като най-бързата SaaS компания, достигнала този етап.

Успехът на Cursor е неразривно свързан с Claude. Както Сам Витевеен, съосновател на Red Dragon (независим разработчик на AI агенти), отбеляза: ‘Трябва да мислите, че техният клиент номер едно е Cursor. Повечето хора на [Cursor] вече използваха модела Claude Sonnet – моделите 3.5. И сега изглежда, че всички просто мигрират към 3.7.’

Връзката между Anthropic и неговата екосистема се простира отвъд отделни компании като Cursor. През ноември Anthropic представи своя Model Context Protocol (MCP) като отворен стандарт, позволяващ на разработчиците да изграждат инструменти, които безпроблемно взаимодействат с моделите на Claude. Този стандарт е широко възприет в общността на разработчиците.

Витевеен обясни значението на този подход: ‘Като стартират това като отворен протокол, те някак си казват: ‘Хей, всички, давайте. Можете да разработите каквото искате, което отговаря на този протокол. Ние ще поддържаме този протокол.’’

Тази стратегия създава добродетелен цикъл: разработчиците изграждат инструменти специално за Claude, подобрявайки неговото предложение за стойност за предприятията, което от своя страна стимулира по-нататъшното приемане и привлича повече разработчици.

Конкурентният пейзаж: Microsoft, OpenAI, Google и Open Source

Докато Anthropic си е извоювал ниша със своя фокусиран подход, конкурентите следват разнообразни стратегии с различна степен на успех.

Microsoft поддържа силна опора чрез своя GitHub Copilot, можейки да се похвали с 1,3 милиона платени потребители и приемане от над 77 000 организации в рамките на приблизително две години. Известни компании като Honeywell, State Street, TD Bank Group и Levi’s са сред неговите потребители. Това широко разпространено приемане се дължи до голяма степен на съществуващите корпоративни отношения на Microsoft и предимството му като първи, произтичащо от ранната му инвестиция в OpenAI и използването на моделите на OpenAI за захранване на Copilot.

Въпреки това, дори Microsoft призна силните страни на Anthropic. През октомври той позволи на потребителите на GitHub Copilot да избират моделите на Anthropic като алтернатива на предложенията на OpenAI. Освен това, последните модели на OpenAI, o1 и по-новият o3 (които наблягат на разсъжденията чрез разширено мислене), не са показали особени предимства при кодиране или агентни задачи.

Google направи свой собствен ход, като наскоро предложи своя Code Assist безплатно, но това изглежда по-скоро като отбранителна маневра, отколкото като стратегическа инициатива.

Движението с отворен код представлява друга значителна сила в този пейзаж. Моделите Llama на Meta са привлекли значително корпоративно внимание, като големи компании като AT&T, DoorDash и Goldman Sachs внедряват базирани на Llama модели за различни приложения. Подходът с отворен код предоставя на предприятията по-голям контрол, опции за персонализиране и ценови предимства, които затворените модели често не могат да съчетаят.

Вместо да гледа на това като на пряка заплаха, Anthropic изглежда се позиционира като допълващ се към отворения код. Корпоративните клиенти могат да използват Claude заедно с модели с отворен код в зависимост от техните специфични изисквания, възприемайки хибриден подход, който максимизира силните страни на всеки.

Всъщност много големи корпоративни компании са възприели мултимодален подход, използвайки който модел е най-подходящ за дадена задача. Intuit, например, първоначално разчиташе на OpenAI като стандарт за своите приложения за данъчни декларации, но впоследствие премина към Claude поради превъзходната му производителност в определени сценарии. Този опит накара Intuit да разработи AI оркестрационна рамка, която улесни безпроблемното превключване между моделите.

Повечето други корпоративни компании оттогава са възприели подобна практика, използвайки най-подходящия модел за всеки конкретен случай на употреба, често интегрирайки модели чрез прости API извиквания. Докато модел с отворен код като Llama може да е подходящ в някои случаи, Claude често е предпочитаният избор за задачи, изискващи висока точност, като изчисления.

Корпоративни последици: Навигиране в прехода към кодиращи агенти

За лицата, вземащи решения в предприятията, този бързо развиващ се пейзаж представлява както възможности, така и предизвикателства.

Сигурността остава първостепенна грижа, но неотдавнашен независим доклад идентифицира Claude 3.7 Sonnet като най-сигурния модел до момента, като единственият тестван, който се оказа ‘устойчив на jailbreak’. Тази позиция на сигурност, съчетана с подкрепата на Anthropic както от Google, така и от Amazon (и интеграцията в AWS Bedrock), го позиционира благоприятно за корпоративно приемане.

Разпространението на кодиращи агенти не просто трансформира начина, по който се разработват приложения; то демократизира процеса. Според GitHub, значителните 92% от базираните в САЩ разработчици в корпоративни компании вече са използвали AI-захранвани инструменти за кодиране на работа преди 18 месеца. Тази цифра вероятно се е увеличила значително оттогава.

Витевеен подчерта преодоляването на пропастта между техническите и нетехническите членове на екипа: ‘Предизвикателството, което хората имат [поради] това, че не са програмисти, е наистина, че те не знаят много от терминологията. Те не знаят най-добрите практики.’ AI кодиращите агенти все повече се справят с това предизвикателство, позволявайки по-ефективно сътрудничество.

За корпоративно приемане, Витевеен се застъпва за балансиран подход: ‘Това е балансът между сигурност и експериментиране в момента. Ясно е, че от страна на разработчиците хората започват да изграждат реални приложения с тези неща.’

Появата на AI кодиращи агенти означава фундаментална промяна в корпоративната разработка на софтуер. Когато се внедрят ефективно, тези инструменти не изместват разработчиците, а по-скоро трансформират ролите им, позволявайки им да се концентрират върху архитектурата и иновациите, а не върху детайлите по внедряването.

Дисциплинираният подход на Anthropic, фокусиран специално върху възможностите за кодиране, докато конкурентите преследват множество приоритети, изглежда дава значителни предимства. До края на 2025 г. този период може да бъде разглеждан ретроспективно като ключовия момент, когато AI кодиращите агенти станаха незаменими корпоративни инструменти, като Claude е начело.

За техническите лица, вземащи решения, императивът е ясен: започнете експериментиране с тези инструменти незабавно или рискувайте да изостанете от конкурентите, които вече ги използват, за да ускорят драстично циклите на разработка. Тази ситуация отразява ранните дни на революцията на iPhone, когато компаниите първоначално се опитваха да ограничат ‘несанкционираните’ устройства от своите корпоративни мрежи, само за да приемат в крайна сметка политиките BYOD, тъй като търсенето на служителите стана огромно. Някои компании, като Honeywell, наскоро по подобен начин се опитаха да спрат ‘нерегламентираната’ употреба на AI инструменти за кодиране, които не са одобрени от IT.

Умните компании вече създават сигурни среди за тестване, за да улеснят контролираното експериментиране. Организациите, които установяват ясни предпазни мерки, като същевременно насърчават иновациите, ще извлекат ползите както от ентусиазма на служителите, така и от прозренията за това как тези инструменти могат най-добре да обслужват техните уникални нужди, позиционирайки се пред конкурентите, които се съпротивляват на промяната. И Claude на Anthropic, поне за момента, е основен бенефициент на това трансформиращо движение.

актуализирано на 2025-03-12

# Anthropic # Claude # Agent