Ushindi wa Siri wa Anthropic: Claude 3.7

Claude 3.7 Sonnet: Kiwango Kipya katika Umahiri wa Kuandika Msimbo

Toleo la hivi karibuni la Claude 3.7 Sonnet, lililotolewa wiki mbili tu zilizopita, linatumika kama ushahidi wa kutosha. Toleo hili jipya limevunja rekodi zilizopo za utendaji wa uandishi wa msimbo. Wakati huo huo, Anthropic ilizindua Claude Code, wakala wa AI wa mstari wa amri iliyoundwa kuharakisha utengenezaji wa programu kwa waandishi wa programu. Kuongeza kasi hii, Cursor, kihariri cha msimbo kinachotumia AI ambacho kinatumia kielelezo cha Claude cha Anthropic, kimeripotiwa kuongezeka hadi dola milioni 100 za mapato ya kila mwaka yanayojirudia ndani ya miezi 12 tu.

Msisitizo wa makusudi wa Anthropic kwenye uandishi wa msimbo unaambatana na utambuzi unaokua miongoni mwa biashara wa uwezo wa mabadiliko wa mawakala wa uandishi wa msimbo wa AI. Mawakala hawa huwezesha watengenezaji wenye uzoefu na watu wasio na utaalamu wa kuandika msimbo kuunda programu kwa kasi na ufanisi usio na kifani. Kama Guillermo Rauch, Mkurugenzi Mtendaji wa Vercel, kampuni inayopanuka kwa kasi inayowezesha watengenezaji (pamoja na wasio waandishi wa msimbo) kupeleka programu za mbele, alivyosema, ‘Anthropic inaendelea kuibuka kidedea.’ Uamuzi wa Vercel mwaka jana wa kubadilisha mtindo wake mkuu wa uandishi wa msimbo kutoka GPT ya OpenAI hadi Claude ya Anthropic, kufuatia tathmini ya kina ya utendaji wao kwenye kazi muhimu za uandishi wa msimbo, unasisitiza jambo hili.

Claude 3.7 Sonnet, iliyozinduliwa Februari 24, imechukua uongozi katika karibu vipimo vyote vya uandishi wa msimbo. Ilipata asilimia 70.3 ya ajabu kwenye kipimo cha SWE-bench kinachoheshimika sana, kipimo cha uwezo wa wakala wa kutengeneza programu. Alama hii inazidi kwa kiasi kikubwa zile za washindani wake wa karibu, o1 ya OpenAI (48.9%) na DeepSeek-R1 (49.2%). Zaidi ya hayo, Claude 3.7 inaonyesha utendaji bora kwenye kazi za kiwakala.

Matokeo haya ya vipimo yamethibitishwa kwa haraka na jumuiya za watengenezaji kupitia majaribio ya ulimwengu halisi. Majadiliano ya mtandaoni, haswa kwenye majukwaa kama Reddit, yakilinganisha Claude 3.7 na Grok 3 (mfumo wa hivi karibuni kutoka xAI ya Elon Musk), mara kwa mara hupendelea mfumo wa Anthropic kwa kazi za uandishi wa msimbo. Mchangiaji mkuu alifupisha hisia: ‘Kulingana na nilichojaribu, Claude 3.7 inaonekana kuwa bora zaidi kwa kuandika msimbo (angalau kwangu).’ Ni muhimu sana kutambua kwamba hata Manus, wakala mpya wa Kichina mwenye madhumuni mengi aliyechukua ulimwengu kwa dhoruba mapema wiki hii, alisema ilikuwa bora kuliko Utafiti wa Kina wa Open AI na kazi nyingine za uhuru, ilijengwa kwa kiasi kikubwa kwenye Claude.

Lengo la Kimkakati: Mchezo wa Biashara wa Anthropic

Mtazamo usioyumba wa Anthropic kwenye uwezo wa kuandika msimbo si wa bahati mbaya. Makadirio yaliyovuja yaliyoripotiwa na The Information yanapendekeza kwamba Anthropic inalenga dola bilioni 34.5 za mapato ifikapo 2027. Hii inawakilisha ongezeko la mara 86 kutoka viwango vyake vya sasa. Sehemu kubwa (takriban 67%) ya mapato haya yanayotarajiwa yanatarajiwa kutoka kwa biashara ya API, huku programu za uandishi wa msimbo wa biashara zikitumika kama injini kuu ya ukuaji. Ingawa Anthropic haijafichua takwimu sahihi za mapato, imeripoti ongezeko la ajabu la 1,000% katika mapato ya uandishi wa msimbo katika robo ya mwisho ya 2024. Kuongeza kasi hii ya kifedha, Anthropic hivi karibuni ilitangaza mzunguko wa ufadhili wa dola bilioni 3.5, ikithamini kampuni hiyo kwa dola bilioni 61.5 za kuvutia.

Mkakati huu unaozingatia uandishi wa msimbo unalingana na matokeo ya Fahirisi ya Kiuchumi ya Anthropic yenyewe. Fahirisi hiyo ilifichua kuwa asilimia 37.2 kubwa ya maswali yaliyoelekezwa kwa Claude yaliangukia chini ya kitengo cha ‘kompyuta na hisabati’. Maswali haya yalijumuisha kimsingi kazi za uhandisi wa programu kama vile urekebishaji wa msimbo, utatuzi, na utatuzi wa mtandao.

Mbinu ya Anthropic inajitokeza katikati ya mazingira ya ushindani, ambapo wapinzani mara nyingi hushikwa na msukosuko wa shughuli, wakijaribu kuhudumia masoko ya biashara na watumiaji kwa anuwai ya vipengele. OpenAI, huku ikidumisha uongozi mkubwa kutokana na utambuzi na kupitishwa kwake mapema kwa watumiaji, inakabiliwa na changamoto ya kuhudumia watumiaji wa kawaida na biashara kwa anuwai ya mifumo na utendakazi. Google, vile vile, inafuata mkakati wa kutoa jalada pana la bidhaa.

Mbinu ya nidhamu ya Anthropic pia inaonekana katika maamuzi yake ya bidhaa. Badala ya kufukuza sehemu ya soko la watumiaji, kampuni imetanguliza vipengele vya kiwango cha biashara kama vile ujumuishaji wa GitHub, kumbukumbu za ukaguzi, ruhusa zinazoweza kubinafsishwa, na vidhibiti vya usalama mahususi kwa kikoa. Miezi sita iliyopita, ilianzisha dirisha kubwa la muktadha la tokeni 500,000 kwa watengenezaji, tofauti kabisa na uamuzi wa Google wa kupunguza dirisha lake la tokeni milioni 1 kwa wajaribu wa kibinafsi. Mtazamo huu wa kimkakati umesababisha toleo la kina, linalozingatia uandishi wa msimbo ambalo linazidi kuvutia biashara.

Utangulizi wa hivi majuzi wa kampuni wa vipengele vinavyowezesha wasio waandishi wa msimbo kuchapisha programu zinazozalishwa na AI ndani ya mashirika yao, pamoja na uboreshaji wa kiweko cha wiki iliyopita unaoangazia uwezo ulioboreshwa wa ushirikiano (pamoja na vidokezo na violezo vinavyoweza kushirikiwa), unaonyesha zaidi mwelekeo huu. Uwekaji huu wa demokrasia unaonyesha mkakati wa ‘Farasi wa Trojan’: hapo awali kuwawezesha watengenezaji kujenga misingi thabiti, ikifuatiwa na kupanua ufikiaji kwa wafanyikazi wengi wa biashara, hatimaye kufikia chumba cha ushirika.

Majaribio ya Vitendo na Claude: Jaribio la KivItendo

Ili kutathmini uwezo wa ulimwengu halisi wa mawakala hawa wa uandishi wa msimbo, jaribio la vitendo lilifanywa, likilenga kujenga hifadhidata ya kuhifadhi makala. Mbinu tatu tofauti zilitumika: Claude 3.7 Sonnet kupitia programu ya Anthropic, wakala wa uandishi wa msimbo wa Cursor, na Claude Code.

Kwa kutumia Claude 3.7 moja kwa moja kupitia programu ya Anthropic, mwongozo uliotolewa ulikuwa wa busara sana, haswa kwa mtu asiye na uzoefu mkubwa wa uandishi wa msimbo. Mfumo huo uliwasilisha chaguzi kadhaa, kuanzia suluhisho thabiti zinazotumia hifadhidata za PostgreSQL hadi njia mbadala nyepesi kama Airtable. Kwa kuchagua suluhisho jepesi, Claude aliongoza kwa utaratibu mchakato wa kutoa makala kutoka kwa API na kuziunganisha kwenye Airtable kwa kutumia huduma ya kiunganishi. Ingawa mchakato huo ulichukua takriban saa mbili, haswa kutokana na changamoto za uthibitishaji, ulifikia kilele katika mfumo unaofanya kazi. Kimsingi, badala ya kuandika msimbo wote kwa uhuru, Claude alitoa mwongozo wa kina wa kufikia matokeo yaliyohitajika.

Cursor, ikiwa na utegemezi wake wa chaguo-msingi kwenye mifumo ya Claude, iliwasilisha uzoefu kamili wa kihariri cha msimbo na kuonyesha mwelekeo mkubwa kuelekea otomatiki. Hata hivyo, ilihitaji ruhusa katika kila hatua, na kusababisha mtiririko wa kazi wa kurudia.

Claude Code ilitoa mbinu tofauti, ikifanya kazi moja kwa moja ndani ya terminal na kutumia SQLite kuunda hifadhidata ya ndani iliyojaa makala kutoka kwa mlisho wa RSS. Suluhisho hili lilithibitika kuwa rahisi na la kutegemewa zaidi katika kufikia lengo la mwisho, ingawa halikuwa thabiti na lenye vipengele vingi ikilinganishwa na utekelezaji wa Airtable. Hii inaangazia biashara asilia zinazohusika na inasisitiza umuhimu wa kuchagua wakala wa uandishi wa msimbo kulingana na mahitaji maalum ya mradi.

Jambo kuu la kuchukua kutoka kwa jaribio hili ni kwamba hata kama mtu asiye mtengenezaji, iliwezekana kujenga programu za hifadhidata zinazofanya kazi kwa kutumia mbinu zote tatu. Hii ingekuwa vigumu kufikiria mwaka mmoja tu uliopita. Na, haswa, mbinu zote tatu zilitegemea uwezo wa msingi wa Claude.

Mfumo wa Ikolojia wa Wakala wa Kuandika Msimbo: Cursor na Zaidi

Labda kiashiria cha kulazimisha zaidi cha mafanikio ya Anthropic ni ukuaji wa ajabu wa Cursor, kihariri cha msimbo cha AI. Ripoti zinaonyesha kuwa Cursor imekusanya watumiaji 360,000, huku zaidi ya 40,000 kati yao wakiwa wateja wanaolipa, ndani ya miezi 12 tu. Njia hii ya ukuaji wa haraka inaweka Cursor kama kampuni ya SaaS inayokua kwa kasi zaidi kufikia hatua hiyo.

Mafanikio ya Cursor yanahusiana kwa asili na Claude. Kama Sam Witteveen, mwanzilishi mwenza wa Red Dragon (msanidi programu huru wa mawakala wa AI), alivyosema, ‘Lazima ufikirie mteja wao nambari moja ni Cursor. Watu wengi kwenye [Cursor] walikuwa wakitumia mfumo wa Claude Sonnet - mifumo 3.5 - tayari. Na sasa inaonekana kila mtu anahamia tu 3.7.’

Uhusiano kati ya Anthropic na mfumo wake wa ikolojia unaenea zaidi ya kampuni binafsi kama Cursor. Mnamo Novemba, Anthropic ilianzisha Itifaki yake ya Muktadha wa Mfumo (MCP) kama kiwango wazi, kinachowezesha watengenezaji kujenga zana zinazoingiliana bila mshono na mifumo ya Claude. Kiwango hiki kimepata kupitishwa kwa wingi ndani ya jumuiya ya watengenezaji.

Witteveen alielezea umuhimu wa mbinu hii: ‘Kwa kuzindua hii kama itifaki wazi, wanasema, ‘Haya, kila mtu, fanyeni. Unaweza kutengeneza chochote unachotaka kinacholingana na itifaki hii. Tutasaidia itifaki hii.’’

Mkakati huu huunda mzunguko mzuri: watengenezaji huunda zana mahususi kwa Claude, na kuongeza pendekezo lake la thamani kwa biashara, ambayo nayo huendesha upitishaji zaidi na kuvutia watengenezaji zaidi.

Mazingira ya Ushindani: Microsoft, OpenAI, Google, na Chanzo Huria

Ingawa Anthropic imejitengenezea nafasi kwa mbinu yake iliyolenga, washindani wanafuata mikakati mbalimbali yenye viwango tofauti vya mafanikio.

Microsoft inadumisha msimamo thabiti kupitia GitHub Copilot yake, ikijivunia watumiaji milioni 1.3 wanaolipa na kupitishwa na zaidi ya mashirika 77,000 ndani ya takriban miaka miwili. Kampuni maarufu kama vile Honeywell, State Street, TD Bank Group, na Levi’s ni miongoni mwa watumiaji wake. Upitishaji huu ulioenea unahusishwa kwa kiasi kikubwa na uhusiano uliopo wa biashara wa Microsoft na faida yake ya kusonga mbele, inayotokana na uwekezaji wake wa mapema katika OpenAI na utumiaji wa mifumo ya OpenAI kuwezesha Copilot.

Hata hivyo, hata Microsoft imekiri uwezo wa Anthropic. Mnamo Oktoba, iliwawezesha watumiaji wa GitHub Copilot kuchagua mifumo ya Anthropic kama njia mbadala ya matoleo ya OpenAI. Zaidi ya hayo, mifumo ya hivi karibuni ya OpenAI, o1 na o3 mpya zaidi (ambayo inasisitiza hoja kupitia mawazo yaliyopanuliwa), haijaonyesha faida fulani katika uandishi wa msimbo au kazi za kiwakala.

Google imefanya hatua yake yenyewe kwa kutoa hivi karibuni Msaada wake wa Msimbo bila malipo, lakini hii inaonekana kuwa hatua ya kujihami zaidi kuliko mpango wa kimkakati.

Harakati ya chanzo huria inawakilisha nguvu nyingine kubwa katika mazingira haya. Mifumo ya Llama ya Meta imepata mvuto mkubwa wa biashara, huku kampuni kubwa kama AT&T, DoorDash, na Goldman Sachs zikipeleka mifumo inayotegemea Llama kwa matumizi mbalimbali. Mbinu ya chanzo huria huwapa biashara udhibiti mkubwa, chaguzi za kubinafsisha, na faida za gharama ambazo mifumo iliyofungwa mara nyingi haiwezi kufanana.

Badala ya kuona hii kama tishio la moja kwa moja, Anthropic inaonekana kujipanga kama inayosaidia chanzo huria. Wateja wa biashara wanaweza kutumia Claude kwa kushirikiana na mifumo ya chanzo huria kulingana na mahitaji yao maalum, wakipitisha mbinu mseto inayoongeza uwezo wa kila moja.

Kwa kweli, kampuni nyingi kubwa za biashara zimepitisha mbinu ya aina nyingi, wakitumia mfumo wowote unaofaa zaidi kwa kazi fulani. Intuit, kwa mfano, hapo awali ilitegemea OpenAI kama chaguo-msingi kwa maombi yake ya kurejesha kodi lakini baadaye ikabadilisha hadi Claude kutokana na utendaji wake bora katika hali fulani. Uzoefu huu ulipelekea Intuit kutengeneza mfumo wa upatanishi wa AI ambao uliwezesha ubadilishaji usio na mshono kati ya mifumo.

Kampuni nyingi za biashara tangu wakati huo zimepitisha mazoezi sawa, wakitumia mfumo unaofaa zaidi kwa kila kesi maalum ya matumizi, mara nyingi zikiunganisha mifumo kupitia simu rahisi za API. Ingawa mfumo wa chanzo huria kama Llama unaweza kufaa katika baadhi ya matukio, Claude mara nyingi ndiye chaguo linalopendelewa kwa kazi zinazohitaji usahihi wa hali ya juu, kama vile hesabu.

Athari za Biashara: Kuabiri Mabadiliko hadi kwa Mawakala wa Kuandika Msimbo

Kwa watoa maamuzi wa biashara, mazingira haya yanayoendelea kwa kasi yanawasilisha fursa na changamoto.

Usalama unasalia kuwa jambo la muhimu sana, lakini ripoti ya hivi majuzi huru ilitambua Claude 3.7 Sonnet kama mfumo salama zaidi hadi sasa, ikiwa ndio pekee iliyojaribiwa ambayo ilithibitika kuwa ‘isiyoweza kuvunjwa jela.’ Msimamo huu wa usalama, pamoja na kuungwa mkono na Anthropic kutoka kwa Google na Amazon (na kuunganishwa kwenye AWS Bedrock), inaiweka vyema kwa kupitishwa na biashara.

Kuenea kwa mawakala wa uandishi wa msimbo si tu kubadilisha jinsi programu zinavyotengenezwa; inademokrasia mchakato. Kulingana na GitHub, asilimia 92 kubwa ya watengenezaji wa Marekani katika kampuni za biashara walikuwa tayari wanatumia zana za uandishi wa msimbo zinazotumia AI kazini miezi 18 iliyopita. Takwimu hii huenda imeongezeka kwa kiasi kikubwa tangu wakati huo.

Witteveen aliangazia kuziba pengo kati ya wanachama wa timu ya kiufundi na wasio wa kiufundi: ‘Changamoto ambayo watu wanayo [kwa sababu ya] kutokuwa mwandishi wa msimbo ni kwamba hawajui mengi ya istilahi. Hawajui mbinu bora.’ Mawakala wa uandishi wa msimbo wa AI wanazidi kushughulikia changamoto hii, na kuwezesha ushirikiano bora zaidi.

Kwa kupitishwa na biashara, Witteveen anatetea mbinu iliyosawazishwa: ‘Ni usawa kati ya usalama na majaribio kwa sasa. Ni wazi, kwa upande wa msanidi programu, watu wanaanza kujenga programu za ulimwengu halisi na mambo haya.’

Kuibuka kwa mawakala wa uandishi wa msimbo wa AI kunaashiria mabadiliko ya kimsingi katika ukuzaji wa programu za biashara. Zikitumiwa kwa ufanisi, zana hizi hazibadilishi watengenezaji bali hubadilisha majukumu yao, na kuwaruhusu kuzingatia usanifu na uvumbuzi badala ya maelezo ya utekelezaji.

Mbinu ya nidhamu ya Anthropic, inayolenga haswa uwezo wa uandishi wa msimbo huku washindani wakifuata vipaumbele vingi, inaonekana kuleta faida kubwa. Kufikia mwisho wa 2025, kipindi hiki kinaweza kuonekana kwa mtazamo wa nyuma kama wakati muhimu ambapo mawakala wa uandishi wa msimbo wa AI walikuja kuwa zana muhimu za biashara, huku Claude akiongoza.

Kwa watoa maamuzi wa kiufundi, jambo la lazima ni wazi: anza majaribio na zana hizi mara moja au hatari ya kuachwa nyuma na washindani ambao tayari wanazitumia kuharakisha sana mizunguko ya maendeleo. Hali hii inaakisi siku za mwanzo za mapinduzi ya iPhone, ambapo kampuni hapo awali zilijaribu kuzuia vifaa ‘visivyoidhinishwa’ kutoka kwa mitandao yao ya ushirika, na hatimaye kukumbatia sera za BYOD kwani mahitaji ya wafanyikazi yalizidi. Baadhi ya kampuni, kama Honeywell, hivi karibuni zimejaribu vile vile kuzima matumizi ya ‘uhuni’ ya zana za uandishi wa msimbo wa AI ambazo hazijaidhinishwa na IT.

Kampuni mahiri tayari zinaanzisha mazingira salama ya sanduku la mchanga ili kuwezesha majaribio yanayodhibitiwa. Mashirika ambayo yanaweka vizuizi wazi huku yakikuza uvumbuzi yatavuna faida za shauku ya wafanyikazi na maarifa kuhusu jinsi zana hizi zinavyoweza kutumikia vyema mahitaji yao ya kipekee, yakijiweka mbele ya washindani wanaopinga mabadiliko. Na Claude ya Anthropic, angalau kwa sasa, ni mnufaika mkuu wa harakati hii ya mabadiliko.