Mtetemeko wa Awali: DeepSeek na Ndoto ya Ufanisi
Kujitokeza kwa DeepSeek AI ya China mapema mwaka huu kulileta mshtuko mkubwa katika mazingira ya uwekezaji wa teknolojia. Mbinu yake iliyoonekana kuwa ya kimapinduzi, ikiahidi akili bandia yenye nguvu na gharama ndogo za kikokotozi, ilizua mara moja uvumi. Simulizi iliundwa haraka: labda upanuzi usiokoma na wa gharama kubwa wa miundombinu ya AI, unaojulikana na ununuzi mkubwa wa chipu na mifumo maalum, ulikuwa karibu kupungua kasi. Soko lilijibu, likionyesha imani kwamba enzi mpya ya AI yenye gharama nafuu inaweza kupunguza kwa kiasi kikubwa ongezeko la matumizi lililotarajiwa.
Hata hivyo, ufahamu kutoka kwa mkusanyiko wa hivi karibuni wa ngazi ya juu wa wataalamu wa sekta unaonyesha picha tofauti kabisa. Mkutano wa generative AI ulioitishwa New York na Bloomberg Intelligence ulipendekeza kuwa tafsiri ya awali, iliyolenga tu uwezekano wa kuokoa gharama, ilikosa hadithi kubwa zaidi. Mbali na kuashiria kupungua kwa matumizi, tukio hilo lilisisitiza hamu isiyoshibika ya uwezo mkubwa zaidi wa AI. Makubaliano hayakuwa kuhusu kupunguza; yalikuwa kuhusu kujua jinsi ya kulisha hamu inayokua kwa kasi ya mifumo ya akili, hata wakati tukitamani sana orodha iwe na gharama nafuu.
Sauti kutoka Mstari wa Mbele: Kiu Isiyozimika ya Uwezo
Majadiliano katika tukio hilo la siku nzima, lililowaleta pamoja watengenezaji, wataalamu wa mikakati, na wawekezaji, yalizunguka mara kwa mara kwenye mada ya mahitaji yanayoongezeka yanayosukuma uwekezaji mkubwa. Mandeep Singh, mchambuzi mkuu wa teknolojia katika Bloomberg Intelligence na mmoja wa waandaaji wa tukio hilo, alielezea hisia iliyotawala kwa ufupi. Akirejelea paneli nyingi na majadiliano ya wataalamu, alibainisha kauli mbiu ya ulimwengu wote: hakuna aliyehusika aliyehisi kuwa anamiliki uwezo wa kutosha wa AI. Hisia kubwa ilikuwa ya kuhitaji zaidi, sio kuwa na nyingi mno.
Muhimu zaidi, Singh aliongeza, hofu ya ‘kiputo cha miundombinu,’ hofu ya kawaida katika sekta za teknolojia zinazopanuka kwa kasi, haikuwepo kabisa kwenye mazungumzo. Lengo lilibaki moja kwa moja kwenye changamoto ya msingi inayoikabili sekta nzima. Anurag Rana, mwenzake Singh na mchambuzi mkuu wa Bloomberg Intelligence kwa huduma za IT na programu, aliielezea kama swali kuu: ‘Tuko wapi katika mzunguko huo [wa ujenzi wa miundombinu ya AI]?’
Wakati akikiri kuwa kubainisha hatua kamili ya ujenzi huu mkubwa bado ni ngumu (‘Hakuna anayejua’ kwa uhakika, Rana alikiri), jambo la DeepSeek bila shaka lilibadilisha mitazamo. Liliingiza dozi kubwa ya matumaini kwamba mizigo mikubwa ya kazi ya AI inaweza kushughulikiwa kiuchumi zaidi. ‘DeepSeek iliwashtua watu wengi,’ Rana aliona. Maana ilikuwa wazi: ikiwa modeli za kisasa za AI zinaweza kweli kufanya kazi kwa ufanisi kwenye vifaa visivyohitaji nguvu nyingi, labda miradi mikubwa, kama ile ya mabilioni ya dola inayosemekana kupangwa na makundi yanayohusisha wachezaji wakubwa wa teknolojia, inaweza kutathminiwa upya au kupunguzwa kwa njia tofauti.
Ndoto, iliyosikika kote sekta kulingana na Rana, ni kwa gharama za uendeshaji wa AI, hasa kwa inference (hatua ambapo modeli zilizofunzwa hutoa utabiri au maudhui), kufuata mwelekeo wa kushuka kwa kasi ulioonekana katika uhifadhi wa kompyuta wingu katika muongo mmoja uliopita. Alikumbuka jinsi uchumi wa kuhifadhi kiasi kikubwa cha data kwenye majukwaa kama Amazon Web Services (AWS) ulivyoboreka sana kwa takriban miaka minane. ‘Kushuka huko kwa gharama… uchumi ulikuwa mzuri,’ alisema. ‘Na hilo ndilo kila mtu analotumaini, kwamba upande wa inference… ikiwa mteremko utashuka hadi kiwango hicho, oh Mungu wangu, kiwango cha kupitishwa kwa AI… kitakuwa cha kuvutia sana.’ Singh alikubaliana, akibainisha kuwa kuwasili kwa DeepSeek kimsingi ‘kumebadilisha mawazo ya kila mtu kuhusu kufikia ufanisi.’
Tamaa hii ya ufanisi ilikuwa dhahiri katika vikao vyote vya mkutano. Wakati paneli nyingi zilichunguza uhalisia wa kuhamisha miradi ya AI ya biashara kutoka hatua za dhana hadi uzalishaji wa moja kwa moja, mjadala sambamba ulikuwa ukisisitiza kila mara hitaji muhimu la kupunguza gharama zinazohusiana na kupeleka na kuendesha modeli hizi za AI. Lengo ni wazi: kudemokrasisha ufikiaji kwa kufanya AI iwezekane kiuchumi kwa anuwai pana ya matumizi na watumiaji. Shawn Edwards, mwanateknolojia mkuu wa Bloomberg mwenyewe, alipendekeza kuwa DeepSeek haikuwa lazima mshangao kamili, bali kielelezo chenye nguvu cha hamu ya ulimwengu wote. ‘Kilichonifanya nifikirie ni kwamba ingekuwa nzuri ikiwa ungeweza kupunga fimbo na kufanya modeli hizi ziendeshe kwa ufanisi wa ajabu,’ alibainisha, akipanua matakwa hayo kwa wigo mzima wa modeli za AI, sio tu mafanikio moja maalum.
Kanuni ya Ueneaji: Kuchochea Mahitaji ya Kompyuta
Moja ya sababu kuu ambazo wataalamu wanatarajia uwekezaji endelevu na mkubwa katika miundombinu ya AI, licha ya jitihada za ufanisi, inatokana na ueneaji mkubwa wa modeli za AI. Mada iliyojirudia katika mkutano wa New York ilikuwa hatua madhubuti ya kuachana na dhana ya modeli moja kubwa ya AI yenye uwezo wa kushughulikia kazi zote.
- Mambo ya Familia: Kama Edwards wa Bloomberg alivyosema, ‘Tunatumia familia ya modeli. Hakuna kitu kama modeli bora zaidi.’ Hii inaonyesha uelewa unaokua kwamba usanifu tofauti wa AI hufanya vizuri katika kazi tofauti - uzalishaji wa lugha, uchambuzi wa data, utambuzi wa picha, ukamilishaji wa msimbo, na kadhalika.
- Ubinafsishaji wa Biashara: Wajumbe wa paneli walikubaliana kwa kiasi kikubwa kwamba ingawa modeli kubwa, za jumla za ‘msingi’ au ‘mpakani’ zitaendelea kutengenezwa na kuboreshwa na maabara kuu za AI, hatua halisi ndani ya biashara inahusisha kupeleka mamia au hata maelfu ya modeli maalum za AI.
- Urekebishaji Maalum na Data Miliki: Nyingi za modeli hizi za biashara zitarekebishwa kutoka kwa modeli za msingi kupitia mchakato unaoitwa fine-tuning. Hii inahusisha kufunza upya mtandao wa neva uliokwisha kufunzwa kwenye data maalum ya kampuni, mara nyingi data miliki. Hii inaruhusu AI kuelewa mazingira ya kipekee ya biashara, istilahi, na mwingiliano wa wateja, ikitoa matokeo muhimu zaidi na yenye thamani kuliko modeli ya jumla ingeweza.
- Kudemokrasisha Maendeleo: Jed Dougherty, akiwakilisha jukwaa la sayansi ya data Dataiku, alisisitiza haja ya ‘chaguo kati ya modeli’ kwa mawakala wa AI wa biashara. Alisisitiza umuhimu wa kuwapa makampuni udhibiti, uwezo wa kuunda, na ukaguzi juu ya zana zao za AI. ‘Tunataka kuweka zana za kujenga vitu hivi mikononi mwa watu,’ Dougherty alisisitiza. ‘Hatutaki PhD kumi wajenge mawakala wote.’ Msukumo huu kuelekea ufikiaji mpana katika maendeleo yenyewe unamaanisha hitaji la miundombinu zaidi ya msingi ili kusaidia juhudi hizi za uundaji zilizosambazwa.
- AI Maalum kwa Chapa: Sekta za ubunifu zinatoa mfano mzuri. Hannah Elsakr, anayeongoza ubia mpya wa biashara katika Adobe, alielezea mkakati wao wa kuweka dau kwenye modeli maalum kama kitofautishi muhimu. ‘Tunaweza kufunza viendelezi vya modeli maalum kwa chapa yako ambavyo vinaweza kusaidia kampeni mpya ya matangazo,’ alielezea, akionyesha jinsi AI inaweza kubinafsishwa ili kudumisha urembo na ujumbe maalum wa chapa.
Zaidi ya utofautishaji wa modeli, kuongezeka kwa upelekaji wa mawakala wa AI ndaniya mtiririko wa kazi wa kampuni ni kichocheo kingine muhimu cha mahitaji ya uchakataji. Mawakala hawa wanatazamwa sio tu kama zana tulivu bali kama washiriki hai wenye uwezo wa kutekeleza kazi za hatua nyingi.
Ray Smith, anayeongoza juhudi za mawakala na otomatiki za Microsoft Copilot Studio, alitabiri mustakabali ambapo watumiaji wataingiliana na mamia ya mawakala maalum kupitia kiolesura kimoja kama Copilot. ‘Hutaingiza mchakato mzima katika wakala mmoja, utaugawanya katika sehemu,’ alielezea. Mawakala hawa, alipendekeza, kimsingi ni ‘programu katika ulimwengu mpya’ wa programu. Dira ni ile ambapo watumiaji wanaeleza tu lengo lao - ‘iambie tunachotaka kukamilisha’ - na wakala huratibu hatua zinazohitajika. ‘Programu za wakala ni njia mpya tu ya mtiririko wa kazi,’ Smith alisema, akisisitiza kuwa kutimiza dira hii sio suala la uwezekano wa kiteknolojia (‘yote yanawezekana kiteknolojia’) bali zaidi kuhusu ‘kasi ambayo tunaijenga.’
Msukumo huu wa kupachika mawakala wa AI kwa undani zaidi katika michakato ya kila siku ya shirika unaongeza zaidi shinikizo la kupunguza gharama na upelekaji mzuri. James McNiven, mkuu wa usimamizi wa bidhaa katika kampuni kubwa ya microprocessor ARM Holdings, aliweka changamoto hiyo katika muktadha wa ufikiaji. ‘Tunawezaje kutoa ufikiaji kwenye vifaa vingi zaidi?’ alitafakari. Akiona modeli zikifikia uwezo karibu wa ‘kiwango cha PhD’ katika kazi maalum, alilinganisha na athari ya mabadiliko ya kuleta mifumo ya malipo ya simu kwa mataifa yanayoendelea miaka iliyopita. Swali kuu linabaki: ‘Tunawezaje kupata hiyo [uwezo wa AI] kwa watu wanaoweza kutumia uwezo huo?’ Kufanya mawakala wa kisasa wa AI wapatikane kwa urahisi kama wasaidizi kwa sehemu kubwa ya wafanyikazi kunahitaji sio tu programu janja bali pia vifaa bora na, bila shaka, uwekezaji zaidi wa miundombinu ya msingi, hata kama ufanisi kwa kila hesabu unaboreka.
Vikwazo vya Kuongeza Ukubwa: Silikoni, Nguvu, na Majitu ya Wingu
Hata modeli za msingi za jumla zinazotumiwa sana zinaongezeka kwa kasi ya kushangaza, zikiweka mzigo mkubwa kwenye miundombinu iliyopo. Dave Brown, anayesimamia kompyuta na mitandao kwa Amazon Web Services (AWS), alifichua kuwa jukwaa lao pekee linawapa wateja ufikiaji wa takriban modeli 1,800 tofauti za AI. Alisisitiza umakini mkubwa wa AWS katika ‘kufanya mengi kupunguza gharama’ ya kuendesha zana hizi zenye nguvu.
Mkakati muhimu kwa watoa huduma wa wingu kama AWS unahusisha kutengeneza silikoni yao maalum. Brown alisisitiza matumizi yanayoongezeka ya chipu zilizoundwa na AWS, kama vile vichakataji vyao vya Trainium vilivyoboreshwa kwa mafunzo ya AI, akisema, ‘AWS inatumia vichakataji vyetu wenyewe zaidi kuliko vichakataji vya kampuni zingine.’ Hatua hii kuelekea vifaa maalum, vya ndani inalenga kudhibiti utendaji na gharama, kupunguza utegemezi kwa wasambazaji wa chipu za jumla kama Nvidia, AMD, na Intel. Licha ya juhudi hizi, Brown alikiri kwa uwazi ukweli wa msingi: ‘Wateja wangefanya zaidi ikiwa gharama ingekuwa chini.’ Dari ya mahitaji kwa sasa inafafanuliwa zaidi na vikwazo vya bajeti kuliko ukosefu wa matumizi yanayowezekana.
Kiwango cha rasilimali zinazohitajika na watengenezaji wakuu wa AI ni kikubwa sana. Brown alibainisha ushirikiano wa kila siku wa AWS na Anthropic, waundaji wa familia ya kisasa ya modeli za lugha za Claude. Michael Gerstenhaber, mkuu wa miingiliano ya programu za matumizi wa Anthropic, akizungumza pamoja na Brown, alielezea ukubwa wa kikokotozi wa AI ya kisasa, hasa modeli zilizoundwa kwa ajili ya hoja ngumu au ‘kufikiri.’ Modeli hizi mara nyingi hutoa maelezo ya kina hatua kwa hatua kwa majibu yao, zikitumia nguvu kubwa ya uchakataji. ‘Modeli za kufikiri husababisha uwezo mwingi kutumika,’ Gerstenhaber alisema.
Wakati Anthropic inafanya kazi kikamilifu na AWS kwenye mbinu za uboreshaji kama ‘prompt caching’ (kuhifadhi na kutumia tena hesabu kutoka kwa mwingiliano wa awali ili kuokoa rasilimali), hitaji la msingi la vifaa linabaki kuwa kubwa sana. Gerstenhaber alisema kwa ukali kwamba Anthropic inahitaji ‘mamia ya maelfu ya vichapuzi’ - chipu maalum za AI - zilizosambazwa ‘katika vituo vingi vya data’ ili tu kuendesha seti yake ya sasa ya modeli. Hii inatoa hisia halisi ya ukubwa kamili wa rasilimali za kompyuta zinazotegemeza mchezaji mmoja tu mkuu wa AI.
Kuongezea changamoto ya kupata na kusimamia makundi makubwa ya silikoni ni matumizi ya nishati yanayoongezeka kwa kasi yanayohusiana na AI. Brown alisisitiza hili kama jambo muhimu, na linaloongezeka kwa kasi, la wasiwasi. Vituo vya data vya sasa vinavyosaidia kazi kubwa za AI tayari vinatumia nguvu inayopimwa kwa mamia ya megawati. Makadirio yanaonyesha mahitaji ya baadaye bila shaka yatapanda hadi kiwango cha gigawati - pato la mitambo mikubwa ya nguvu. ‘Nguvu inayotumia,’ Brown alionya, akirejelea AI, ‘ni kubwa, na alama yake ni kubwa katika vituo vingi vya data.’ Mahitaji haya yanayoongezeka ya nishati yanawakilisha sio tu gharama kubwa za uendeshaji lakini pia changamoto kubwa za kimazingira na kimantiki kwa kuweka na kuendesha kizazi kijacho cha miundombinu ya AI.
Kadi Pori ya Kiuchumi: Kivuli Juu ya Mipango ya Ukuaji
Licha ya mtazamo wa matumaini unaochochewa na maendeleo ya kiteknolojia na matumizi yanayochipuka, kigezo kikubwa kinatanda juu ya makadirio yote ya uwekezaji wa AI: hali pana ya uchumi. Mkutano wa Bloomberg Intelligence ulipomalizika, wahudhuriaji walikuwa tayari wakiona wasiwasi sokoni kutokana na vifurushi vipya vya ushuru wa kimataifa vilivyotangazwa, vilivyoonekana kuwa vikubwa kuliko ilivyotarajiwa.
Hii inatumika kama ukumbusho wenye nguvu kwamba ramani za barabara za kiteknolojia zenye matarajio makubwa zinaweza kuvurugwa haraka na upepo mkali wa kiuchumi mkuu. Rana wa Bloomberg alionya kwamba ingawa matumizi ya AI yanaweza kuwa salama kwa kiasi fulani mwanzoni, maeneo ya jadi ya uwekezaji wa IT wa kampuni, kama vile seva na uhifadhi usiohusiana na AI, yanaweza kuwa wahanga wa kwanza katika mdororo wa kiuchumi. ‘Jambo lingine kubwa tunalolizingatia ni matumizi ya teknolojia isiyo ya AI,’ alibainisha, akielezea wasiwasi juu ya athari inayoweza kutokea kwa watoa huduma wakubwa wa teknolojia kuelekea msimu wa mapato, hata kabla ya kuzingatia bajeti za AI haswa.
Kuna nadharia iliyoenea, hata hivyo, kwamba AI inaweza kudhihirisha ustahimilivu wa kipekee. Rana alipendekeza kwamba Maafisa Wakuu wa Fedha (CFOs) katika mashirika makubwa, wakikabiliwa na vikwazo vya bajeti kutokana na kutokuwa na uhakika wa kiuchumi au hata mdororo, wanaweza kuchagua kuweka kipaumbele katika mipango ya AI. Wanaweza kuhamisha fedha kutoka maeneo yasiyo muhimu sana ili kulinda uwekezaji wa kimkakati wa AI unaoonekana kuwa muhimu kwa ushindani wa baadaye.
Hata hivyo, mtazamo huu wa matumaini hauna uhakika kabisa. Jaribio la mwisho, kulingana na Rana, litakuwa ikiwa mashirika makubwa yatadumisha malengo yao makali ya matumizi ya mtaji, hasa kwa ajili ya kujenga vituo vya data vya AI, mbele ya kuongezeka kwa kutokuwa na uhakika wa kiuchumi. Swali muhimu linabaki: ‘Je, watasema, ‘Unajua nini? Hali haina uhakika sana.’’ Jibu litaamua ikiwa kasi inayoonekana kutozuilika nyuma ya matumizi ya miundombinu ya AI itaendelea kupanda bila kukoma au itakabiliwa na kusimama kusikotarajiwa kunakoamriwa na hali halisi ya uchumi wa dunia.