Mfumo wa AI wa Biti 1 wa Microsoft: Hatua Kubwa

BitNet b1.58 2B4T ya Microsoft: Kuruka Kuelekea Kompyuta Inayotumia Nishati Vizuri

Katika maendeleo ya msingi, watafiti wa Microsoft wamezindua BitNet b1.58 2B4T, mfumo wa lugha kubwa (LLM) wa biti 1 wa chanzo huria wenye vigezo bilioni mbili na uliyo fundishwa kwa tokeni trilioni nne. Kinachotofautisha mfumo huu wa AI ni uwezo wake wa kufanya kazi kwa ufanisi kwenye CPU za kawaida, kufungua uwezekano mpya wa upatikanaji wa AI na ufanisi wa nishati. Njia hii bunifu inaruhusu mfumo kufanya kazi kwa ufanisi hata kwenye vifaa kama chipu ya Apple M2, kama ilivyoonyeshwa na TechCrunch, na kuifanya ipatikane kwa urahisi kwa majaribio kwenye majukwaa kama Hugging Face.

Ubunifu Mkuu: Usanifu wa Biti 1

Msingi wa ufanisi wa BitNet upo katika matumizi yake ya uzani wa biti 1, kwa kutumia thamani tatu tu zinazowezekana: -1, 0, na +1. Ubunifu huu, ulioainishwa kitaalamu kama ‘mfumo wa biti 1.58’ kutokana na usaidizi wake kwa thamani tatu, hupunguza kwa kiasi kikubwa mahitaji ya kumbukumbu ikilinganishwa na mifumo ya jadi ya AI ambayo hutegemea miundo ya pointi inayoelea ya biti 32 au biti 16. Kwa hivyo, BitNet inafanikisha ufanisi bora wa uendeshaji huku ikihitaji kumbukumbu kidogo na nguvu ya kompyuta. Usanifu huu uliorahisishwa huwezesha mfumo kufanya kazi kwa ufanisi kwenye vifaa vyenye rasilimali ndogo, na kufanya AI ipatikane zaidi kwa watumiaji na vifaa vingi zaidi.

Hata hivyo, unyenyekevu huu unakuja na biashara: kupungua kidogo kwa usahihi ikilinganishwa na mifumo mikubwa na ngumu zaidi ya AI. Ili kulipa fidia kwa hili, BitNet b1.58 2B4T inatumia hifadhidata kubwa ya mafunzo, inayokadiriwa kujumuisha zaidi ya vitabu milioni 33, na kuiwezesha kufikia utendaji shindani licha ya ukubwa wake mdogo.

Kulinganisha na Mifumo Mikuu

Timu ya utafiti ya Microsoft ilijaribu kwa ukali BitNet b1.58 2B4T dhidi ya mifumo mikuu inayoongoza, ikiwa ni pamoja na LLaMa 3.2 1B ya Meta, Gemma 3 1B ya Google, na Qwen 2.5 1.5B ya Alibaba. Matokeo yalionyesha kuwa BitNet b1.58 2B4T ilifanya vizuri katika majaribio mengi, hata ikizidi mifumo hii katika vigezo fulani. Hasa, ilifanikiwa hili huku ikitumia MB 400 tu za kumbukumbu isiyoingizwa, chini sana kuliko GB 1.4 inayohitajika na mfumo mdogo unaofuata, Gemma 3 1B. Hii inaonyesha ufanisi wa kipekee wa kumbukumbu wa BitNet na uwezekano wake wa kupelekwa kwenye vifaa vilivyo na rasilimali ndogo.

Kuboresha Utendaji kwa bitnet.cpp

Ili kufungua uwezo kamili wa ufanisi wa BitNet, ni muhimu kutumia mfumo wa inferensi wa bitnet.cpp. Timu ya maendeleo ilisema wazi kuwa mfumo hautafikia faida sawa za utendaji unapotumiwa na maktaba za kawaida za transfoma, hata kwa marekebisho muhimu.

Mfumo wa bitnet.cpp, unaopatikana kwenye GitHub, hutoa safu ya kernel zilizoboreshwa ambazo zinawezesha inferensi ya haraka na isiyo na hasara ya mifumo ya biti 1.58 kwenye CPU, na usaidizi wa siku zijazo uliopangwa kwa NPU na GPU. Ingawa kwa sasa haina usaidizi kwa vifaa maalum vya AI, inawawezesha watu wenye kompyuta za kawaida kufanya majaribio na AI bila hitaji la vipengele vya gharama kubwa, maalum.

Athari kwa AI Endelevu

Mifumo ya AI mara nyingi hukosolewa kwa matumizi yao makubwa ya nishati wakati wa mafunzo na uendeshaji. LLM nyepesi kama BitNet b1.58 2B4T hutoa suluhisho la kuahidi kwa kuwezesha utekelezaji wa ndani wa mifumo ya AI kwenye vifaa visivyo na nguvu. Mabadiliko haya kuelekea usindikaji wa AI uliogatuliwa yanaweza kupunguza kwa kiasi kikubwa utegemezi wetu kwenye vituo vikubwa vya data na kuweka demokrasia ufikiaji wa akili bandia, kuruhusu watu binafsi bila ufikiaji wa wasindikaji wa hivi karibuni, NPU, au GPU kutumia nguvu ya AI.

Kuingia Ndani Zaidi Katika Vipengele vya Kiufundi

Ubunifu wa usanifu wa BitNet upo katika uwezo wake wa kuwakilisha uzani na biti ndogo. Kijadi, mitandao ya neva hutumia nambari zinazoelea, kwa kawaida biti 32 au biti 16, kuwakilisha uzani ambao huamua nguvu ya miunganisho kati ya neuroni. Nambari hizi zinazoelea huruhusu anuwai kubwa ya thamani na marekebisho sahihi wakati wa mafunzo, na kuwezesha mtandao kujifunza mifumo ngumu. Hata hivyo, pia hutumia kumbukumbu kubwa na rasilimali za kompyuta.

BitNet, kwa upande mwingine, hurahisisha sana uwakilishi huu kwa kutumia uzani wa biti 1 tu, ambao unaweza kuchukua thamani za -1, 0, au +1. Urahisishaji huu hupunguza kwa kiasi kikubwa ukubwa wa kumbukumbu ya mfumo, na kuiruhusu kuwa ndogo sana na yenye ufanisi zaidi. Kupungua kwa ugumu wa kompyuta pia kunamaanisha kuwa BitNet inaweza kutekelezwa kwenye vifaa visivyo na nguvu, kama vile CPU, bila kuhitaji vichapuzi maalum kama vile GPU au NPU.

Uchaguzi wa -1, 0, na +1 kama thamani zinazowezekana za uzani wa biti 1 pia ni muhimu. Thamani za -1 na +1 zinawakilisha miunganisho hasi na chanya yenye nguvu, mtawalia, wakati thamani ya 0 inawakilisha hakuna muunganisho. Uwakilishi huu wa ternary unaruhusu mtandao kujifunza miunganisho ya kusisimua na ya kuzuia, ambayo ni muhimu kwa utambuzi ngumu wa muundo.

Changamoto za Mafunzo na Suluhisho

Kufundisha mtandao wa neva wa biti 1 huleta changamoto za kipekee. Asili tofauti ya uzani hufanya iwe vigumu kutumia mbinu za kawaida za uboreshaji zinazotegemea gradient, ambazo hutegemea marekebisho endelevu ya uzani. Ili kushinda changamoto hii, watafiti wameanzisha algoriti maalum za mafunzo ambazo zimeundwa kulingana na asili tofauti ya mitandao ya biti 1.

Mbinu moja ya kawaida ni kutumia mbinu inayoitwa ‘estimator ya moja kwa moja’ (STE). STE inakadiri gradient ya uzani tofauti kwa kupitisha gradient moja kwa moja kupitia kazi ya quantization, kwa ufanisi kutibu uzani tofauti kama kama walikuwa endelevu wakati wa kupita nyuma. Hii inaruhusu mtandao kufundishwa kwa kutumia algoriti za kawaida za backpropagation, licha ya asili isiyo tofauti ya kazi ya quantization.

Changamoto nyingine katika kufundisha mitandao ya biti 1 ni uwezekano wa ukosefu wa utulivu. Aina ndogo ya thamani za uzani inaweza kusababisha oscillations na divergence wakati wa mafunzo. Ili kupunguza hili, watafiti mara nyingi huajiri mbinu kama vile normalization ya uzani na kupunguza gradient, ambayo husaidia kuimarisha mchakato wa mafunzo.

Jukumu la Maktaba ya bitnet.cpp

Maktaba ya bitnet.cpp ina jukumu muhimu katika kutambua faida za ufanisi za BitNet. Maktaba hii hutoa seti ya kernel zilizoboreshwa ambazo zimeundwa mahsusi kwa ajili ya kufanya inferensi na mifumo ya biti 1 kwenye CPU. Kernel hizi hutumia mbinu kama vile shughuli za bitwise na majedwali ya utafutaji ili kuharakisha hesabu ya bidhaa za nukta ambazo ziko moyoni mwa hesabu za mtandao wa neva.

Maktaba ya bitnet.cpp pia inajumuisha usaidizi kwa quantization na dequantization, ambazo ni michakato ya kubadilisha kati ya uzani wa biti 1 na uanzishaji wa pointi inayoelea. Operesheni hizi ni muhimu kwa kuingiliana na sehemu zingine za mfumo wa ikolojia wa AI, ambao kwa kawaida hutumia uwakilishi wa pointi inayoelea.

Kwa kutoa utekelezaji ulioboreshwa sana wa operesheni za msingi zinazohitajika kwa inferensi ya biti 1, maktaba ya bitnet.cpp inawezesha BitNet kufikia faida kubwa za utendaji kwenye CPU, na kuifanya kuwa suluhisho la vitendo la kupeleka mifumo ya AI kwenye vifaa vilivyo na rasilimali ndogo.

Athari Pana ya AI ya Biti 1

Maendeleo ya BitNet yanawakilisha hatua muhimu kuelekea AI endelevu na inayopatikana zaidi. Kwa kupunguza mahitaji ya kumbukumbu na kompyuta ya mifumo ya AI, BitNet inafungua uwezekano mpya wa kupeleka AI kwenye anuwai pana ya vifaa, ikiwa ni pamoja na simu za mkononi, mifumo iliyoingizwa, na vifaa vya IoT.

Uwekaji huu wa demokrasia wa AI unaweza kuwa na athari kubwa katika tasnia mbalimbali. Kwa mfano, inaweza kuwezesha maendeleo ya wasaidizi wa kibinafsi wa AI ambao huendeshwa ndani ya nchi kwenye simu za mkononi, kutoa watumiaji faragha na usalama ulioimarishwa. Inaweza pia kuwezesha upelekaji wa sensorer zinazoendeshwa na AI katika maeneo ya mbali, kutoa ufuatiliaji na uchambuzi wa wakati halisi bila hitaji la miundombinu ya gharama kubwa ya wingu.

Zaidi ya hayo, ufanisi wa nishati wa BitNet unaweza kusaidia kupunguza alama ya kaboni ya tasnia ya AI. Mafunzo na uendeshaji wa mifumo mikubwa ya AI hutumia kiasi kikubwa cha nishati, na kuchangia uzalishaji wa gesi chafuzi. Kwa kupunguza matumizi ya nishati ya mifumo ya AI, BitNet inaweza kusaidia kufanya AI iwe endelevu zaidi kimazingira.

Mielekeo ya Baadaye na Changamoto

Wakati BitNet inawakilisha maendeleo muhimu katika teknolojia ya AI, bado kuna changamoto kadhaa na fursa za utafiti wa baadaye. Changamoto moja muhimu ni kuboresha usahihi wa mifumo ya biti 1. Wakati BitNet imeonyesha utendaji shindani kwenye vigezo fulani, bado inashindwa na mifumo mikubwa na ngumu zaidi katika suala la usahihi wa jumla.

Watafiti wanachunguza mbinu mbalimbali za kushughulikia changamoto hii, ikiwa ni pamoja na:

  • Algoriti za mafunzo za kisasa zaidi: Kuendeleza algoriti za mafunzo ambazo zinafaa zaidi kwa asili tofauti ya uzani wa biti 1 inaweza kusababisha maboresho makubwa katika usahihi.
  • Usanifu mpya wa mtandao: Kubuni usanifu wa mtandao ambao umeundwa mahsusi kwa mifumo ya biti 1 pia kunaweza kuboresha utendaji.
  • Mbinu mseto: Kuchanganya uzani wa biti 1 na mbinu zingine, kama vile kunereka kwa ujuzi, kunaweza kuruhusu mifumo ya biti 1 kujifunza kutoka kwa mifumo mikubwa na sahihi zaidi.

Eneo lingine muhimu la utafiti ni kupanua maktaba ya bitnet.cpp ili kusaidia NPU na GPU. Wakati utekelezaji wa sasa unazingatia CPU, kuongeza usaidizi kwa vichapuzi maalum vya AI kunaweza kuboresha zaidi utendaji wa BitNet.

Hatimaye, ni muhimu kuchunguza athari za kimaadili za AI ya biti 1. AI inavyozidi kuenea, ni muhimu kuhakikisha kwamba inatumika kwa uwajibikaji na kimaadili. Hii inajumuisha kushughulikia masuala kama vile upendeleo, haki, na uwazi.

Hitimisho: Mabadiliko ya Dhana katika Maendeleo ya AI

BitNet b1.58 2B4T ya Microsoft inawakilisha mabadiliko ya dhana katika maendeleo ya AI, kuonyesha kwamba inawezekana kuunda mifumo yenye nguvu na yenye ufanisi ya AI na kumbukumbu ndogo na rasilimali za kompyuta. Mafanikio haya yana uwezo wa kuweka demokrasia ufikiaji wa AI, kupunguza alama ya kaboni ya tasnia ya AI, na kuwezesha maendeleo ya matumizi mapya na bunifu ya AI. Utafiti unavyoendelea kusonga mbele katika uwanja huu, tunaweza kutarajia kuona maendeleo ya kuvutia zaidi katika miaka ijayo. Hatua kuelekea AI ya biti 1 sio tu maendeleo ya kiteknolojia, lakini hatua kuelekea mustakabali endelevu zaidi na unaopatikana kwa akili bandia. Kwa kufanya AI iwe yenye ufanisi zaidi na inapelekwa kwenye anuwai pana ya vifaa, tunaweza kufungua uwezo wake wa kutatua baadhi ya changamoto kubwa zaidi za ulimwengu, kutoka kwa mabadiliko ya tabianchi hadi huduma ya afya. Mustakabali wa AI sio tu juu ya kujenga mifumo mikubwa na ngumu zaidi, lakini juu ya kujenga mifumo yenye akili zaidi na yenye ufanisi zaidi. BitNet ni ushuhuda wa maono haya, na inafungua njia kwa enzi mpya ya uvumbuzi wa AI.