Ulimwengu wa akili bandia kwa sasa ni jukwaa la tofauti kubwa. Katika upande mmoja, kiasi kikubwa cha fedha kinaelekezwa kwa makampuni makubwa ya teknolojia, kikichochea matarajio ya nguvu za kiakili zisizo na kifani na kuzua mijadala kuhusu uwezekano wa kiputo cha uwekezaji. Thamani za mabilioni ya dola zinakuwa jambo la kawaida, huku kukiwa na minong’ono ya duru za ufadhili kufikia viwango vya juu sana. Hata hivyo, katika jukwaa lingine tulivu linalofanana, mapinduzi yanachemka ndani ya duru za kitaaluma na jumuiya za chanzo huria. Hapa, watafiti wanaonyesha ubunifu wa ajabu, wakitengeneza mifumo yenye uwezo ya AI jenereta si kwa mabilioni, bali wakati mwingine kwa fedha kidogo tu, wakipinga kimsingi dhana iliyoenea kwamba ukubwa daima ni bora katika mbio za ukuu wa akili bandia.
Mgawanyiko huu unazidi kuwa dhahiri. Fikiria OpenAI, kampuni kubwa nyuma ya ChatGPT, ambayo inaripotiwa kutafuta uwekezaji zaidi ambao unaweza kuongeza thamani yake hadi dola bilioni 300 za kushangaza. Takwimu hizo, pamoja na makadirio ya mapato yanayoongezeka kwa kasi, zinaonyesha picha ya matumaini yasiyozuiliwa na ukuaji wa kielelezo. Wakati huo huo, hata hivyo, mitetemo ya tahadhari inatikisa misingi ya furaha hii ya AI. Hisa za teknolojia zinazojulikana kama ‘Magnificent 7’, ambazo kwa muda mrefu zimekuwa kipenzi cha soko kwa kiasi kikubwa kutokana na uwezo wao wa AI, zimepitia vipindi vya utendaji duni kwa kiasi kikubwa, ikionyesha wasiwasi wa wawekezaji unaanza kuingia. Wasiwasi huu unaongezwa na maonyo kutoka kwa wakongwe wa sekta hiyo, kama mwanzilishi mwenza wa Alibaba, Joe Tsai, ambaye hivi karibuni alionyesha dalili za kutia wasiwasi za uwezekano wa kiputo cha AI kuundwa, hasa ndani ya soko la US. Kiwango kikubwa cha uwekezaji kinachohitajika, hasa kwa vituo vikubwa vya data vinavyoendesha mifumo hii tata, kinachunguzwa kwa kina. Je, viwango vya sasa vya matumizi ni endelevu, au vinaashiria msisimko usio na mantiki uliotenganishwa na hali halisi ya muda mfupi?
Kivuli cha Kiputo cha AI Kinatanda
Wasiwasi kuhusu kiputo cha AI si tu wasiwasi wa kifedha usio dhahiri; unaakisi maswali ya kina kuhusu kasi na mwelekeo wa maendeleo ya AI yenyewe. Simulizi kwa kiasi kikubwa imetawaliwa na wachezaji wachache wakuu wanaowekeza mabilioni kujenga Mifumo Mikubwa ya Lugha (LLMs) inayozidi kuwa mikubwa. Hii imeunda mazingira ambapo uongozi wa soko unaonekana kutegemea kuwa na mifuko mikubwa zaidi na miundombinu ya kompyuta iliyoenea zaidi.
- Kizunguzungu cha Thamani: Thamani inayowezekana ya OpenAI ya dola bilioni 300, ingawa inaakisi imani kubwa kutoka kwa wawekezaji fulani, pia inazua maswali. Je, takwimu hii inahalalishwa na uwezo wa sasa na mikondo ya mapato, au ina uzito mkubwa kuelekea mafanikio ya baadaye, labda yasiyo na uhakika? Milinganisho ya kihistoria na milipuko na kuporomoka kwa teknolojia hapo awali, kama enzi ya dot-com, bila shaka inajitokeza, ikihimiza tahadhari.
- Uchunguzi wa Uwekezaji wa Miundombinu: Mabilioni yanayomiminwa katika vituo vya data maalum vya AI na vifaa maalum, kama vile GPU za hali ya juu, yanawakilisha matumizi makubwa ya mtaji. Onyo la Joe Tsai linaangazia hatari inayohusishwa na uwekezaji mkubwa kama huo wa awali, hasa ikiwa njia ya kupata mapato itathibitika kuwa ndefu au ngumu zaidi kuliko ilivyotarajiwa. Ufanisi na faida ya uwekezaji huu vinakuwa mada muhimu za majadiliano.
- Ishara za Soko: Utendaji unaobadilika-badilika wa makampuni makubwa ya teknolojia yaliyowekeza sana katika AI unaonyesha kiwango cha mashaka sokoni. Ingawa uwezo wa muda mrefu unabaki kuwa kivutio kikubwa, tete ya muda mfupi inaonyesha kuwa wawekezaji wanatathmini upya hatari kikamilifu na kuhoji uendelevu wa mwelekeo wa sasa wa ukuaji. Hatima ya IPO zijazo katika nafasi ya AI, kama vile toleo linalotarajiwa kutoka kwa mtaalamu wa chip za AI CoreWeave, inafuatiliwa kwa karibu kama kipimo cha hisia za soko. Je, itawasha tena shauku au kuthibitisha wasiwasi uliopo?
- Vipimo vya Kijiografia na Kisiasa: Mbio za AI pia zina misingi muhimu ya kijiografia na kisiasa, hasa kati ya US na China. Matumizi makubwa nchini US kwa kiasi fulani yanasukumwa na hamu ya kudumisha ushindani. Hii imesababisha mijadala tata ya kisera, ikiwa ni pamoja na wito wa udhibiti mkali zaidi wa usafirishaji wa teknolojia ya hali ya juu ya semiconductor ili uwezekano wa kupunguza kasi ya maendeleo ya China. Kinyume chake, mtaji wa ubia unaendelea kutiririka katika kampuni changa za AI za China, ikionyesha ushindani wa kimataifa ambapo umahiri wa kiteknolojia na mkakati wa kiuchumi vimeunganishwa kwa karibu.
Mazingira haya ya hatari kubwa, matumizi makubwa yanaweka jukwaa kwa uvumbuzi wa kuvuruga unaopinga utaratibu uliowekwa. Kujitokeza kwa njia mbadala za bei nafuu kwa kiasi kikubwa kunalazimisha tathmini upya ya iwapo ukokotoaji wa nguvu kubwa na ukubwa mkubwa ndiyo njia pekee za kusonga mbele.
Madai ya Kuvuruga ya DeepSeek na Athari Zake
Katika mazingira haya ya matumizi makubwa na wasiwasi unaoongezeka aliingia DeepSeek, taasisi yenye makao yake China ambayo ilitoa madai ya kushangaza: ilikuwa imetengeneza mfumo wake mkuu wa lugha wa AI jenereta wa R1 kwa dola milioni 6 tu. Takwimu hii, ikiwa ni ndogo mara nyingi kuliko uwekezaji unaodhaniwa wa mabilioni ya dola na wenzao wa Magharibi, mara moja ilisababisha mshtuko katika sekta hiyo.
Ingawa mashaka kuhusu hesabu ya dola milioni 6 yanaendelea – kuhoji ni gharama gani zilizojumuishwa na kutengwa – athari ya tangazo hilo haikupingika. Ilitumika kama kichocheo chenye nguvu, ikilazimisha uchunguzi muhimu wa miundo ya gharama na mbinu za maendeleo zinazotumiwa na viongozi wa soko. Ikiwa mfumo wenye uwezo wa kuridhisha ungeweza kweli kujengwa kwa mamilioni badala ya mabilioni, hiyo ilimaanisha nini kuhusu ufanisi wa mbinu za sasa?
- Kupinga Simulizi: Madai ya DeepSeek, yawe sahihi au la, yalichoma simulizi iliyoenea kwamba maendeleo ya AI ya kisasa yalikuwa tu uwanja wa makampuni ya dola trilioni yenye rasilimali zisizo na kikomo. Ilianzisha uwezekano wa mazingira ya maendeleo yaliyogawanywa zaidi kidemokrasia.
- Kuchochea Uchunguzi: Iliongeza uchunguzi ambao tayari ulikuwa ukiangukia kwenye matumizi makubwa ya makampuni kama OpenAI inayoungwa mkono na Microsoft. Wawekezaji, wachambuzi, na washindani walianza kuuliza maswali magumu zaidi kuhusu ugawaji wa rasilimali na faida ya uwekezaji kwa miradi hii yenye mtaji mkubwa.
- Mwangwi wa Kijiografia na Kisiasa: Madai hayo pia yalikuwa na mwangwi ndani ya muktadha wa ushindani wa kiteknolojia kati ya US na China. Ilipendekeza kuwa njia mbadala, zinazoweza kuwa na ufanisi zaidi wa rasilimali kuelekea umahiri wa AI zinaweza kuwepo, ikiongeza safu nyingine ya utata kwa majadiliano kuhusu uongozi wa kiteknolojia na ushindani wa kimkakati. Hii ilichochea mjadala zaidi juu ya sera kama vile vikwazo vya chip, huku ikihimiza wakati huo huo wawekezaji wa mitaji ya ubia kuangalia kwa karibu wachezaji wanaochipukia nchini China ambao wanaweza kuwa na mifumo ya maendeleo yenye ufanisi zaidi.
Licha ya mashaka, kutolewa kwa DeepSeek R1, hasa vipengele vyake vya utafiti huria vinavyoambatana, kulitoa ufahamu muhimu ambao ungewatia moyo wengine. Haikuwa tu gharama iliyodaiwa, bali mbinu zinazowezekana zilizodokezwa, ndizo zilizozua udadisi na uvumbuzi mahali pengine, hasa katika maabara za kitaaluma zinazofanya kazi chini ya vikwazo tofauti sana vya kifedha.
Kuibuka kwa AI ya Gharama Nafuu Sana: Mapinduzi ya Chuo Kikuu
Wakati makampuni makubwa yakipambana na bajeti za mabilioni ya dola na shinikizo la soko, aina tofauti ya mapinduzi ya AI ilikuwa ikichukua sura kimya kimya katika kumbi za taaluma. Watafiti, wasio na mzigo wa mahitaji ya haraka ya kibiashara lakini wakiwa na ufadhili mdogo sana, walianza kuchunguza njia za kuiga kanuni zilizo nyuma ya AI ya hali ya juu, ikiwa si ukubwa wenyewe, kwa kutumia rasilimali ndogo. Mfano mkuu uliibuka kutoka Chuo Kikuu cha California, Berkeley.
Timu katika Berkeley, iliyovutiwa na maendeleo ya hivi karibuni lakini ikikosa mtaji mkubwa wa maabara za viwandani, ilianzisha mradi uliopewa jina la TinyZero. Lengo lao lilikuwa la kijasiri: wangeweza kuonyesha tabia za kisasa za AI, hasa aina ya hoja inayoruhusu mifumo ‘kufikiri’ kabla ya kujibu, kwa kutumia mfumo uliopunguzwa kwa kiasi kikubwa na bajeti? Jibu lilithibitika kuwa ndiyo kubwa. Walifanikiwa kuzaa upya vipengele vya msingi vya dhana ya hoja iliyochunguzwa na OpenAI na DeepSeek kwa gharama ya chini ya kushangaza - karibu $30.
Hii haikufikiwa kwa kujenga mshindani wa moja kwa moja wa GPT-4, bali kwa kupunguza kwa ujanja utata wa mfumo na kazi.
- Jaribio la $30: Takwimu hii kimsingi iliwakilisha gharama ya kukodisha GPU mbili za Nvidia H200 kwenye jukwaa la wingu la umma kwa muda muhimu wa mafunzo. Ilionyesha uwezekano wa kutumia miundombinu iliyopo ya wingu kwa utafiti wa kisasa bila uwekezaji mkubwa wa awali wa vifaa.
- Upimaji wa Mfumo: Mradi wa TinyZero ulitumia mfumo wa ‘3B’, ukirejelea takriban vigezo bilioni tatu. Hii ni ndogo kwa kiasi kikubwa kuliko LLM kubwa zaidi, ambazo zinaweza kujivunia mamia ya mabilioni au hata trilioni za vigezo. Ufahamu muhimu ulikuwa kwamba tabia tata zinaweza kujitokeza hata katika mifumo midogo ikiwa kazi imeundwa ipasavyo.
- Msukumo kutoka kwa Majitu na Wapinzani: Jiayi Pan, kiongozi wa mradi wa TinyZero, alibainisha kuwa mafanikio kutoka OpenAI, hasa dhana zinazohusu mifumo kutumia muda mwingi kuchakata kabla ya kujibu, yalikuwa msukumo mkuu. Hata hivyo, ilikuwa utafiti huria wa DeepSeek R1 ambao ulitoa mwongozo unaowezekana wa jinsi ya kufikia uwezo huu ulioboreshwa wa hoja, ingawa gharama ya mafunzo ya DeepSeek iliyoripotiwa ya dola milioni 6 bado ilikuwa mbali zaidi ya uwezo wa timu ya chuo kikuu.
Timu ya Berkeley ilidhania kwamba kwa kupunguza ukubwa wa mfumo na utata wa tatizo lililohitaji kutatua, bado wangeweza kuona ‘tabia ya hoja inayojitokeza’ inayotakiwa. Mbinu hii ya upunguzaji ilikuwa muhimu katika kupunguza gharama kwa kiasi kikubwa huku ikiwezesha uchunguzi muhimu wa kisayansi.
Kufafanua ‘Wakati wa Aha’: Hoja kwa Bajeti
Mafanikio ya msingi ya mradi wa TinyZero, na mipango kama hiyo ya gharama nafuu, yako katika kuonyesha kile ambacho watafiti mara nyingi huita ‘wakati wa Aha’ - hatua ambapo mfumo wa AI huanza kuonyesha uwezo halisi wa hoja na utatuzi wa matatizo, badala ya kulinganisha tu mifumo au kurejesha habari iliyohifadhiwa. Tabia hii inayojitokeza ni lengo kuu kwa watengenezaji wa hata mifumo mikubwa zaidi.
Ili kupima dhana yao na kuibua tabia hii kwa kiwango kidogo, timu ya Berkeley ilitumia kazi maalum, iliyozuiliwa: mchezo wa hisabati uitwao ‘Countdown’.
- Mchezo wa Countdown: Mchezo huu unahitaji AI kufikia nambari lengwa kwa kutumia seti fulani ya nambari za kuanzia na shughuli za msingi za hesabu (kujumlisha, kutoa, kuzidisha, kugawanya). Muhimu zaidi, mafanikio katika Countdown yanategemea zaidi hoja za kimkakati na upangaji - kuchunguza michanganyiko tofauti na mfuatano wa shughuli - kuliko kukumbuka kiasi kikubwa cha maarifa ya hisabati yaliyokuwepo awali.
- Kujifunza Kupitia Mchezo: Hapo awali, mfumo wa TinyZero uliukaribia mchezo kwa nasibu, ukijaribu michanganyiko karibu bila mpangilio. Hata hivyo, kupitia mchakato wa ujifunzaji wa kuimarisha (kujifunza kutokana na majaribio na makosa na tuzo), ulianza kutambua mifumo na mikakati. Ulijifunza kurekebisha mbinu yake, kuacha njia zisizo na ufanisi, na kukaribia haraka zaidi ufumbuzi sahihi. Kimsingi ulijifunza jinsi ya kuhoji ndani ya sheria zilizofafanuliwa za mchezo.
- Uthibitishaji Binafsi Unajitokeza: Kwa umuhimu, mfumo uliofunzwa ulianza kuonyesha dalili za uthibitishaji binafsi - kutathmini hatua zake za kati na ufumbuzi unaowezekana ili kubaini ikiwa zilikuwa zikielekea kwenye nambari lengwa. Uwezo huu wa kutathmini ndani na kusahihisha mwendo ni alama ya hoja za hali ya juu zaidi.
Kama Jiayi Pan alivyoeleza, “Tunaonyesha kwamba kwa mfumo mdogo kama 3B, unaweza kujifunza kuhoji kuhusu matatizo rahisi na kuanza kujifunza kujithibitisha na kutafuta ufumbuzi bora.” Hii ilionyesha kuwa mifumo ya msingi inayosimamia hoja na ‘wakati wa Aha’, ambayo hapo awali ilihusishwa hasa na mifumo mikubwa, ya gharama kubwa, inaweza kuigwa na kusomwa katika mazingira yenye rasilimali chache sana. Mafanikio ya TinyZero yalithibitisha kuwa dhana za AI za mstari wa mbele hazikuwa tu uwanja wa makampuni makubwa ya teknolojia bali zingeweza kufikiwa na watafiti, wahandisi, na hata wapenzi wenye bajeti ndogo, na kukuza mfumo ikolojia unaojumuisha zaidi kwa uchunguzi wa AI. Uamuzi wa timu kushiriki matokeo yao kwa uwazi, hasa kupitia majukwaa kama GitHub, uliruhusu wengine kuiga majaribio na kupata uzoefu huu wa ‘wakati wa Aha’ moja kwa moja kwa gharama ndogo kuliko gharama ya pizza chache.
Stanford Yajiunga na Mbio: Kuthibitisha Ujifunzaji wa Gharama Nafuu
Mitetemeko iliyoundwa na TinyZero ilienea haraka kupitia jumuiya ya kitaaluma ya AI. Watafiti katika Chuo Kikuu cha Stanford, ambao tayari walikuwa wakichunguza dhana kama hizo na hata walikuwa wameanzisha mchezo wa Countdown kama kazi ya utafiti hapo awali, waliona kazi ya timu ya Berkeley kuwa muhimu sana na yenye kuthibitisha.
Wakiongozwa na Kanishk Gandhi, timu ya Stanford ilikuwa ikichunguza swali linalohusiana, la msingi: kwa nini baadhi ya LLM huonyesha maboresho makubwa, karibu ya ghafla katika uwezo wao wa hoja wakati wa mafunzo, wakati wengine wanaonekana kudumaa? Kuelewa mifumo ya msingi inayoendesha miruko hii katika uwezo ni muhimu kwa kujenga AI yenye ufanisi zaidi na ya kuaminika.
- Kujenga juu ya Msingi wa Pamoja: Gandhi alikiri thamani ya TinyZero, akisema ilikuwa ‘nzuri’ kwa sehemu kwa sababu ilifanikiwa kutumia kazi ya Countdown ambayo timu yake mwenyewe ilikuwa ikiisoma. Muunganiko huu uliruhusu uthibitisho wa haraka na urudufishaji wa mawazo katika vikundi tofauti vya utafiti.
- Kushinda Vikwazo vya Uhandisi: Watafiti wa Stanford pia waliangazia jinsi maendeleo yao yalivyokuwa yamekwamishwa hapo awali na changamoto za uhandisi. Upatikanaji wa zana za chanzo huria ukawa muhimu katika kushinda vikwazo hivi.
- Nguvu ya Zana za Chanzo Huria: Hasa, Gandhi aliusifu mfumo wa Volcano Engine Reinforcement Learning (VERL), mradi wa chanzo huria uliotengenezwa na ByteDance (kampuni mama ya TikTok), kama kuwa ‘muhimu kwa kuendesha majaribio yetu’. Uwiano kati ya uwezo wa VERL na mahitaji ya majaribio ya timu ya Stanford uliharakisha kwa kiasi kikubwa mizunguko yao ya utafiti.
Utegemezi huu kwa vipengele vya chanzo huria unasisitiza kipengele muhimu cha harakati za AI za gharama nafuu. Maendeleo mara nyingi hujengwa kwa ushirikiano, kwa kutumia zana na ufahamu unaoshirikiwa kwa uhuru ndani ya jumuiya. Gandhi alitoa maoni zaidi kwamba mafanikio makubwa ya kisayansi katika kuelewa hoja na akili za LLM huenda si lazima yatokane tu na maabara kubwa, zenye ufadhili mzuri za viwandani tena. Alisema kuwa ‘uelewa wa kisayansi wa LLM za sasa unakosekana, hata ndani ya maabara kubwa,’ ukiacha nafasi kubwa kwa michango kutoka kwa ‘DIY AI, chanzo huria, na taaluma.’ Miradi hii midogo, yenye wepesi zaidi inaweza kuchunguza matukio maalum kwa kina, ikitoa ufahamu unaonufaisha uwanja mzima.
Shujaa Asiyeimbwa: Misingi ya Chanzo Huria
Mafanikio ya ajabu ya miradi kama TinyZero, yanayoonyesha tabia za kisasa za AI kwa makumi ya dola, yanategemea sana kipengele muhimu, ambacho mara nyingi hakithaminiwi vya kutosha: mfumo ikolojia mpana wa mifumo na zana za AI za chanzo huria na uzito huria. Ingawa gharama ndogo ya jaribio maalum inaweza kuwa ndogo, inajengwa juu ya misingi ambayo mara nyingi inawakilisha mamilioni, ikiwa si mabilioni, ya dola katika uwekezaji wa awali.
Nina Singer, mwanasayansi mkuu wa kujifunza kwa mashine katika kampuni ya ushauri ya AI OneSix, alitoa muktadha muhimu. Alisema kuwa gharama ya mafunzo ya TinyZero ya $30, ingawa ni sahihi kwa kazi maalum iliyofanywa na timu ya Berkeley, haizingatii gharama ya awali ya maendeleo ya mifumo ya msingi iliyotumia.
- Kujenga juu ya Mabega ya Majitu: Mafunzo ya TinyZero yalitumia si tu mfumo wa VERL wa ByteDance bali pia Qwen ya Alibaba Cloud, LLM ya chanzo huria. Alibaba iliwekeza rasilimali kubwa - uwezekano wa mamilioni - katika kutengeneza Qwen kabla ya kutoa ‘uzito’ wake (vigezo vilivyojifunzwa vinavyofafanua uwezo wa mfumo) kwa umma.
- Thamani ya Uzito Huria: Singer alisisitiza kuwa hii si ukosoaji wa TinyZero bali inaangazia thamani kubwa na umuhimu wa mifumo ya uzito huria. Kwa kutoa vigezo vya mfumo, hata kama seti kamili ya data na usanifu wa mafunzo unabaki kuwa wa siri, makampuni kama Alibaba yanawawezesha watafiti na taasisi ndogo kujenga juu ya kazi yao, kufanya majaribio, na kuvumbua bila kuhitaji kurudia mchakato wa gharama kubwa wa mafunzo ya awali kutoka mwanzo.
- Kudemokrasisha Urekebishaji Mzuri: Mbinu hii huria inakuza uwanja unaokua wa ‘urekebishaji mzuri’ (fine-tuning), ambapo mifumo midogo ya AI inabadilishwa au kuboreshwa kwa kazi maalum. Kama Singer alivyobainisha, mifumo hii iliyorekebishwa vizuri mara nyingi inaweza ‘kushindana na mifumo mikubwa zaidi kwa sehemu ndogo ya ukubwa na gharama’ kwa madhumuni yao yaliyoteuliwa. Mifano ni mingi, kama vile Sky-T1, inayowapa watumiaji uwezo wa kufundisha toleo lao wenyewe la mfumo wa hali ya juu kwa karibu $450, au Qwen ya Alibaba yenyewe, inayowezesha urekebishaji mzuri kwa gharama ndogo kama $6.
Utegemezi huu kwa misingi huria huunda mfumo ikolojia wenye nguvu ambapo uvumbuzi unaweza kutokea katika ngazi nyingi. Mashirika makubwa yanawekeza sana katika kuunda mifumo yenye nguvu ya msingi, wakati jumuiya pana inatumia mali hizi kuchunguza matumizi mapya, kufanya utafiti, na kuendeleza ufumbuzi maalum kwa uchumi zaidi. Uhusiano huu wa kutegemeana unaendesha maendeleo ya haraka na demokrasia katika uwanja huo.
Kupinga Dhana ya ‘Ukubwa ni Bora’
Hadithi za mafanikio zinazojitokeza kutoka kwa miradi kama TinyZero na mwenendo mpana wa urekebishaji mzuri wenye ufanisi, wa gharama nafuu zinatoa changamoto kubwa kwa imani ya muda mrefu ya sekta kwamba maendeleo katika AI ni kazi tu ya ukubwa - data zaidi, vigezo zaidi, nguvu zaidi ya kompyuta.
Moja ya athari kubwa zaidi, kama ilivyoangaziwa na Nina Singer, ni kwamba ubora wa data na mafunzo maalum ya kazi mara nyingi yanaweza kuwa muhimu zaidi kuliko ukubwa wa mfumo wenyewe. Jaribio la TinyZero lilionyesha kuwa hata mfumo mdogo kiasi (vigezo bilioni 3) ungeweza kujifunza tabia tata kama vile kujisahihisha na uboreshaji wa kurudia wakati ulifundishwa kwa ufanisi kwenye kazi iliyofafanuliwa vizuri.
- Faida Zinazopungua kwa Ukubwa?: Ugunduzi huu unahoji moja kwa moja dhana kwamba ni mifumo mikubwa tu kama mfululizo wa GPT wa OpenAI au Claude wa Anthropic, pamoja na mamia yao ya mabilioni au trilioni za vigezo, ndiyo yenye uwezo wa kujifunza kwa ustadi kama huo. Singer alipendekeza, “Mradi huu unapendekeza kwamba tunaweza kuwa tayari tumevuka kizingiti ambapo vigezo vya ziada vinatoa faida zinazopungua - angalau kwa kazi fulani.” Ingawa mifumo mikubwa inaweza kubaki na faida katika ujumla na upana wa maarifa, kwa matumizi maalum, mifumo iliyoongezwa ukubwa kupita kiasi inaweza kuwakilisha matumizi mabaya, kwa upande wa gharama na mahitaji ya kikokotozi.
- Mabadiliko Kuelekea Ufanisi na Umaalumu: Mazingira ya AI yanaweza kuwa yanapitia mabadiliko ya hila lakini muhimu. Badala ya kuzingatia kwa kipekee kujenga mifumo ya msingi inayozidi kuwa mikubwa, umakini unaongezeka unaelekezwa kwa ufanisi, upatikanaji, na akili inayolengwa. Kuunda mifumo midogo, iliyoboreshwa sana kwa vikoa au kazi maalum kunathibitika kuwa njia mbadala inayowezekana na yenye kuvutia kiuchumi.
- Shinikizo kwa Mifumo Iliyofungwa: Uwezo unaokua na upatikanaji wa mifumo ya uzito huria na mbinu za gharama nafuu za urekebishaji mzuri huweka shinikizo la ushindani kwa makampuni ambayo kimsingi hutoa uwezo wao wa AI kupitia API zilizozuiliwa (Application Programming Interfaces). Kama Singer alivyobainisha, makampuni kama OpenAI na Anthropic yanaweza kuhitaji kuzidi kuhalalisha pendekezo la thamani la mifumo yao ikolojia iliyofungwa, hasa ‘kadiri njia mbadala huria zinapoanza kulingana au kuzidi uwezo wao katika vikoa maalum.’
Hii haimaanishi lazima mwisho wa mifumo mikubwa ya msingi, ambayo itaendelea kutumika kama sehemu muhimu za kuanzia. Hata hivyo, inapendekeza mustakabali ambapo mfumo ikolojia wa AI ni tofauti zaidi, ukijumuisha mchanganyiko wa mifumo mikubwa ya jumla na kuenea kwa mifumo midogo, maalum, na yenye ufanisi mkubwa iliyoundwa kwa mahitaji maalum.
Wimbi la Udemokrasishaji: AI kwa Watu Wengi Zaidi?
Muunganiko wa kompyuta ya wingu inayopatikana, zana zenye nguvu za chanzo huria, na ufanisi uliothibitishwa wa mifumo midogo, iliyorekebishwa vizuri unachochea wimbi la udemokrasishaji katika mazingira yote ya AI. Kile ambacho hapo awali kilikuwa uwanja wa kipekee wa maabara za utafiti za wasomi na mashirika ya teknolojia yenye bajeti za mabilioni ya dola kinazidi kupatikana kwa anuwai pana ya wahusika.
Watu binafsi, watafiti wa kitaaluma, kampuni changa, na makampuni madogo wanagundua kuwa wanaweza kujihusisha kwa maana na dhana za hali ya juu za AI na maendeleo bila kuhitaji uwekezaji wa miundombinu usiozuilika.
- Kupunguza Vizuizi vya Kuingia: Uwezo wa kurekebisha vizuri mfumo wenye uwezo kwa mamia au hata makumi ya dola, ukijenga juu ya misingi ya uzito huria, unapunguza kwa kiasi kikubwa kizuizi cha kuingia kwa majaribio na maendeleo ya matumizi.
- Kukuza Ubunifu: Upatikanaji huu unahimiza dimbwi pana la talanta kuchangia katika uwanja huo. Watafiti wanaweza kupima mawazo mapya kwa urahisi zaidi, wajasiriamali wanaweza kuendeleza ufumbuzi maalum wa AI kwa uchumi zaidi, na wapenzi wanaweza kuchunguza teknolojia ya kisasa moja kwa moja.
- Uboreshaji Unaongozwa na Jumuiya: Mafanikio ya juhudi zinazoongozwa na jumuiya katika kuboresha na kubobea mifumo ya uzito huria yanaonyesha nguvu ya maendeleo ya ushirikiano. Akili hii ya pamoja wakati mwingine inaweza kupita mizunguko ya urudufishaji ndani