Mkakati Mseto wa Ant Group wa Chipu za AI

Katika uwanja wenye ushindani mkali wa maendeleo ya akili bandia (AI), upatikanaji wa teknolojia ya kisasa ya semiconductor mara nyingi huamua kasi ya uvumbuzi. Kwa makampuni makubwa ya teknolojia ya China, upatikanaji huu umekuwa mgumu zaidi, ukiathiriwa na mivutano ya kijiografia na udhibiti mkali wa usafirishaji bidhaa uliowekwa na Marekani (United States). Katikati ya mazingira haya yenye changamoto, Ant Group, kampuni kubwa ya teknolojia ya fedha inayohusiana na Alibaba, inatengeneza njia yake ya kipekee. Kampuni hiyo kimkakati inatumia mchanganyiko tofauti wa semiconductor, kutoka kwa wauzaji wa Marekani na wa ndani, kuendesha matarajio yake ya AI, hasa ikilenga kuimarisha ufanisi na gharama nafuu za kufundisha mifumo tata ya AI.

Mbinu hii iliyopangwa kwa makini ni zaidi ya suluhisho la kiufundi tu; inawakilisha mabadiliko ya kimkakati ya kimsingi. Kwa kuunganisha kwa makusudi chipu kutoka kwa watengenezaji mbalimbali, ikiwa ni pamoja na mbadala za ndani, Ant Group inalenga kupunguza hatari zinazohusiana na usumbufu wa mnyororo wa ugavi na kupunguza utegemezi wake kwa muuzaji mmoja, hasa wale walio chini ya vikwazo vya biashara vya kimataifa. Mseto huu ni muhimu kwa kuhakikisha mwendelezo na uthabiti wa utafiti na maendeleo yake ya AI. Lengo kuu ni mara mbili: kudumisha kasi katika uvumbuzi wa AI huku ikiboresha gharama kubwa zinazohusiana na kufundisha mifumo mikubwa.

Nguvu ya Utaalamu: Kukumbatia Mchanganyiko wa Wataalamu (MoE)

Katikati ya mkakati wa maunzi wa Ant Group ni kupitishwa kwake kwa usanifu wa hali ya juu wa AI unaojulikana kama Mchanganyiko wa Wataalamu (Mixture of Experts - MoE). Mbinu hii inawakilisha mabadiliko makubwa kutoka kwa mifumo ya jadi ya AI ya monolithic, ambapo mtandao mmoja mkubwa wa neva hujaribu kujifunza na kushughulikia nyanja zote za kazi fulani. Mbinu ya MoE, kinyume chake, hutumia muundo uliosambazwa zaidi na maalumu. Inafanya kazi kama kamati ya wataalamu badala ya mtaalamu mmoja wa jumla.

Fikiria tatizo tata linalohitaji maarifa mbalimbali. Badala ya kumtegemea msomi mmoja mwenye ujuzi mwingi, unakusanya timu: mwanahisabati, mwanaisimu, mwanahistoria, na labda mwanafizikia. ‘Mtandao wa lango’ (gating network) hufanya kazi kama msambazaji, akichambua kazi zinazoingia au pointi za data na kuzielekeza kwa akili kwa mfumo wa ‘mtaalamu’ unaofaa zaidi ndani ya mfumo mkuu. Kila mfumo wa mtaalamu umefundishwa kufanya vizuri zaidi katika aina maalum za pembejeo au kazi ndogo. Kwa mfano, katika mfumo wa lugha, mtaalamu mmoja anaweza kuwa na utaalamu wa kuelewa istilahi za kiufundi, mwingine katika mitindo ya uandishi wa ubunifu, na wa tatu katika mazungumzo ya kawaida.

Faida kuu ya muundo huu wa moduli iko katika ufanisi wake wa kikokotozi. Wakati wa mafunzo au inference (wakati mfumo unafanya utabiri), ni mifumo husika ya wataalamu na mtandao wa lango tu ndio huwashwa kwa pembejeo fulani. Ukokotoaji huu wa kuchagua unatofautiana sana na mifumo minene (dense models) ambapo mtandao mzima, na mabilioni au hata matrilioni yake ya vigezo (parameters), lazima uhusishwe kwa kila ukokotoaji mmoja. Kwa hivyo, mifumo ya MoE inaweza kufikia utendaji unaolingana au hata bora zaidi kuliko mifumo minene huku ikihitaji nguvu ndogo sana ya kikokotozi na, kwa hivyo, nishati kidogo.

Ant Group imetumia faida hii ya usanifu kwa ufanisi. Utafiti wa ndani na matumizi ya vitendo yameonyesha kuwa MoE inaruhusu kampuni kufikia matokeo thabiti ya mafunzo hata wakati wa kutumia maunzi yenye nguvu kidogo, yanayopatikana kwa urahisi zaidi, au ya gharama nafuu. Kulingana na matokeo yaliyoshirikiwa na kampuni, utekelezaji huu wa kimkakati wa MoE umewezesha kupungua kwa gharama za kompyuta kwa 20% zinazohusiana na kufundisha mifumo yake ya AI. Uboreshaji huu wa gharama sio tu akiba ya ziada; ni kiwezeshi cha kimkakati, kinachoruhusu Ant kufuata miradi mikubwa ya AI bila lazima kutegemea tu vitengo vya gharama kubwa zaidi, vya hali ya juu vya usindikaji wa michoro (GPUs) ambavyo vinazidi kuwa vigumu kwa makampuni ya China kupata. Faida hii ya ufanisi inashughulikia moja kwa moja vikwazo vya maunzi vilivyowekwa na mazingira ya nje.

Mkusanyiko wa Silicon: Jalada la Maunzi la Ant

Utekelezaji wa vitendo wa mkakati wa Ant Group unahusisha kuabiri mazingira magumu ya semiconductor. Miundombinu ya mafunzo ya AI ya kampuni hiyo inaripotiwa kuendeshwa na safu mbalimbali za chipu, ikionyesha kujitolea kwake kwa kubadilika na uthabiti. Hii inajumuisha silicon iliyoundwa ndani na kampuni yake tanzu, Alibaba, ikimaanisha chipu zilizotengenezwa na kitengo cha semiconductor cha Alibaba, T-Head. Zaidi ya hayo, Ant inajumuisha chipu kutoka Huawei, kampuni nyingine kubwa ya teknolojia ya China ambayo imewekeza pakubwa katika kutengeneza vichapuzi vyake vya AI (kama mfululizo wa Ascend) kujibu vikwazo vya US.

Ingawa Ant Group kihistoria imetumia GPUs zenye utendaji wa juu kutoka Nvidia, kiongozi asiye na ubishi katika soko la mafunzo ya AI, udhibiti unaoendelea wa usafirishaji bidhaa wa US umelazimisha mabadiliko. Kanuni hizi zinazuia haswa uuzaji wa vichapuzi vya hali ya juu zaidi vya AI kwa mashirika ya China, zikitaja wasiwasi wa usalama wa taifa. Ingawa Nvidia bado inaweza kusambaza chipu zenye vipimo vya chini kwa soko la China, Ant Group inaonekana kupanua kikamilifu msingi wake wa wauzaji ili kufidia ufikiaji mdogo wa bidhaa za hali ya juu za Nvidia.

Mseto huu unaangazia kwa uwazi chipu kutoka Advanced Micro Devices (AMD). AMD imeibuka kama mshindani mkubwa kwa Nvidia katika nafasi ya kompyuta ya utendaji wa juu na AI, ikitoa GPUs zenye nguvu ambazo zinatoa mbadala inayowezekana kwa mizigo fulani ya kazi. Kwa kujumuisha maunzi ya AMD pamoja na chaguzi za ndani kutoka Alibaba na Huawei, Ant inaunda mazingira ya kompyuta yenye mchanganyiko (heterogeneous computing environment). Mbinu hii ya kuchanganya na kulinganisha, ingawa inaweza kuongeza ugumu katika uboreshaji wa programu na usimamizi wa mzigo wa kazi, inatoa unyumbufu muhimu. Inaruhusu kampuni kurekebisha matumizi yake ya maunzi kulingana na upatikanaji, gharama, na mahitaji maalum ya kikokotozi ya mifumo na kazi tofauti za AI, na hivyo kukwepa vikwazo vinavyosababishwa na kutegemea chanzo kimoja, kilichozuiliwa.

Mandhari ya mkakati huu ni mtandao tata wa udhibiti wa usafirishaji bidhaa wa US. Hatua hizi zimeimarishwa hatua kwa hatua, zikilenga kuzuia maendeleo ya China katika utengenezaji wa semiconductor za hali ya juu na maendeleo ya AI. Ingawa awali zililenga chipu za hali ya juu kabisa, vikwazo vimebadilika, vikiathiri anuwai pana ya maunzi na vifaa vya utengenezaji wa semiconductor. Nvidia, kwa mfano, imelazimika kuunda matoleo maalum, yenye utendaji wa chini wa chipu zake kuu za AI (kama A800 na H800, zinazotokana na A100 na H100) kwa soko la China ili kutii kanuni hizi. Mkakati wa Ant wa kukumbatia mbadala kutoka AMD na wachezaji wa ndani ni jibu la moja kwa moja, la kimatendo kwa shinikizo hili la kisheria, likionyesha juhudi za kudumisha ushindani wa AI ndani ya vikwazo vilivyopo.

AI Kazini: Kubadilisha Huduma za Afya

Maendeleo ya Ant Group katika ufanisi wa AI sio tu mazoezi ya kinadharia; yanatafsiriwa kikamilifu katika matumizi ya ulimwengu halisi, kwa kuzingatia kwa kiasi kikubwa sekta ya afya. Hivi karibuni kampuni ilizindua maboresho makubwa kwa suluhisho zake za AI zilizoundwa kwa ajili ya huduma za afya, ikisisitiza athari za vitendo za mkakati wake wa msingi wa teknolojia.

Uwezo huu ulioboreshwa wa AI unaripotiwa kuwa tayari unatumika katika taasisi kadhaa mashuhuri za afya katika miji mikubwa ya China, ikiwa ni pamoja na Beijing, Shanghai, Hangzhou (makao makuu ya Ant), na Ningbo. Hospitali kuu saba na mashirika ya afya yanatumia AI ya Ant kuboresha nyanja mbalimbali za shughuli zao na huduma kwa wagonjwa.

Msingi wa mfumo wa AI wa afya wa Ant wenyewe ni mfano wa uvumbuzi wa ushirikiano na kutumia nguvu mbalimbali za kiteknolojia. Umejengwa juu ya mchanganyiko wa mifumo mikubwa ya lugha (LLMs) yenye nguvu:

  • Mifumo ya R1 na V3 ya DeepSeek: DeepSeek ni kampuni mashuhuri ya utafiti wa AI ya China inayojulikana kwa kutengeneza mifumo yenye uwezo ya chanzo huria, mara nyingi ikifikia viwango vya juu vya utendaji.
  • Qwen ya Alibaba: Hii ni familia ya mifumo mikubwa ya lugha inayomilikiwa na kampuni tanzu ya Ant, Alibaba, inayojumuisha ukubwa na uwezo mbalimbali.
  • Mfumo wa BaiLing wa Ant: Hii inaonyesha juhudi za ndani za Ant Group katika kutengeneza mifumo maalum ya AI iliyoundwa kulingana na mahitaji yake maalum, ikiwezekana kujumuisha data na utaalamu wa kifedha na pengine maalum kwa afya.

Msingi huu wa mifumo mingi unaruhusu suluhisho la AI la afya kutumia msingi mpana wa maarifa na uwezo. Kulingana na Ant Group, mfumo huo una uwezo wa kushughulikia maswali juu ya mada mbalimbali za matibabu, ikiwezekana kutumika kama zana muhimu kwa wataalamu wa afya wanaotafuta habari za haraka na wagonjwa wanaotafuta maarifa ya jumla ya matibabu (ingawa ufafanuzi makini wa jukumu lake dhidi ya ushauri wa kitaalamu wa matibabu ni muhimu).

Zaidi ya urejeshaji wa habari, kampuni inasema kuwa mfumo wa AI umeundwa kuboresha huduma za wagonjwa. Ingawa maelezo maalum yanajitokeza, hii inaweza kujumuisha anuwai ya matumizi, kama vile:

  • Uchambuzi wa Akili (Intelligent Triage): Kusaidia katika kuweka kipaumbele mahitaji ya wagonjwa kulingana na dalili zilizoelezwa.
  • Upangaji na Usimamizi wa Miadi: Kuendesha kiotomatiki na kuboresha mchakato wa kuweka miadi.
  • Ufuatiliaji Baada ya Kutokwa Hospitalini: Kutoa vikumbusho vya kiotomatiki au kufuatilia maendeleo ya kupona kwa wagonjwa.
  • Msaada wa Utawala: Kusaidia wafanyakazi wa afya na kazi za nyaraka, muhtasari, au uingizaji data, na hivyo kuokoa muda kwa huduma ya moja kwa moja kwa wagonjwa.

Upelekaji katika hospitali kuu unaashiria hatua muhimu katika kuthibitisha manufaa ya teknolojia na kuabiri ugumu wa kikoa cha afya, ambacho kinahusisha mahitaji magumu ya usahihi, kutegemewa, na faragha ya data.

Kupanga Njia Zaidi ya GPUs za Kulipia

Tukiangalia mbele, mkakati wa Ant Group unaonekana kuendana na azma pana ndani ya tasnia ya teknolojia ya China: kufikia utendaji wa hali ya juu wa AI bila kutegemea tu GPUs za hali ya juu zaidi, ambazo mara nyingi zimezuiliwa. Kampuni hiyo inaripotiwa kupanga kufuata njia iliyochukuliwa na mashirika kama DeepSeek, ikilenga mbinu za kuongeza mifumo ya AI yenye utendaji wa juu ‘bila GPUs za kulipia’.

Azma hii inaashiria imani kwamba uvumbuzi wa usanifu (kama MoE), uboreshaji wa programu, na utumiaji mzuri wa maunzi mbalimbali, yanayoweza kuwa na nguvu kidogo, kwa pamoja yanaweza kuziba pengo la utendaji lililoundwa na ufikiaji mdogo wa silicon ya hali ya juu. Ni mkakati uliozaliwa kwa sehemu kutokana na ulazima kwa sababu ya udhibiti wa usafirishaji bidhaa, lakini pia unaonyesha njia inayoweza kuwa endelevu kuelekea maendeleo ya AI yenye gharama nafuu na yaliyodemokrasishwa zaidi.

Kufikia lengo hili kunahusisha kuchunguza njia mbalimbali zaidi ya MoE tu:

  • Ufanisi wa Algoriti: Kutengeneza algoriti mpya za AI zinazohitaji nguvu ndogo ya kikokotozi kwa mafunzo na inference.
  • Mbinu za Uboreshaji wa Mfumo: Kutumia mbinu kama quantization (kupunguza usahihi wa nambari zinazotumiwa katika ukokotoaji) na pruning (kuondoa sehemu zisizo za lazima za mtandao wa neva) kufanya mifumo iwe midogo na yenye kasi zaidi bila kupoteza utendaji kwa kiasi kikubwa.
  • Mifumo ya Programu (Software Frameworks): Kuunda programu za kisasa zinazoweza kusimamia na kusambaza kwa ufanisi mizigo ya kazi ya AI katika mazingira ya maunzi yenye mchanganyiko, na kuongeza matumizi ya rasilimali za kompyuta zilizopo.
  • Maunzi Maalum ya Ndani: Uwekezaji unaoendelea na utumiaji wa vichapuzi vya AI vilivyotengenezwa na kampuni za China kama Huawei (Ascend), Alibaba (T-Head), na wengine wanaoweza kujitokeza, vilivyoundwa mahsusi kwa kazi za AI.

Ufuatiliaji wa Ant Group wa njia hii, pamoja na wengine katika mfumo wa ikolojia wa teknolojia wa China, unaweza kuwa na athari kubwa. Ikiwa itafanikiwa, inaweza kuonyesha kuwa uongozi katika AI hautegemei tu kuwa na ufikiaji wa chipu za kasi zaidi, lakini pia unategemea uvumbuzi katika programu, usanifu, na uboreshaji wa kiwango cha mfumo. Inawakilisha juhudi za dhati za kujenga uwezo wa AI thabiti na unaojitosheleza, ukiabiri ugumu wa mazingira ya sasa ya teknolojia ya kimataifa kupitia mseto wa kimkakati na uvumbuzi usiokoma. Ujumuishaji wa semiconductor za US na China, zilizoboreshwa kupitia mbinu kama MoE na kutumika katika sekta muhimu kama afya, unaonyesha mbinu ya kimatendo na inayobadilika ili kudumisha maendeleo ya AI chini ya shinikizo.