Gemma 3n: Enzi Mpya ya AI Inayovuka Mipaka

Gemma 3n ya Google inazindua enzi mpya ya akili bandia (AI) inayozalisha. Mfumo huu ni mdogo, wa haraka, na muhimu zaidi, unaweza kufanya kazi nje ya mtandao kwenye simu, ukipeleka teknolojia ya hali ya juu ya AI kwenye vifaa tunavyotumia kila siku. Gemma 3n haielewi tu sauti, picha na maandishi; usahihi wake ni wa ajabu, na utendaji wake katika Chatbot Arena unazidi hata GPT-4.1 Nano.

Ubunifu wa Muundo wa Gemma 3n

Ili kukaribisha mustakabali wa AI kwenye kifaa, Google DeepMind imeshirikiana kwa ukaribu na viongozi katika vifaa vya rununu kama vile Qualcomm Technologies, MediaTek, na Samsung System LSI ili kuunda muundo mpya kabisa.

Muundo huu unalenga kuboresha utendaji wa AI inayozalisha kwenye vifaa vyenye rasilimali chache kama vile simu, kompyuta kibao na kompyuta ndogo. Ili kufikia lengo hili, muundo huo unatumia uvumbuzi tatu muhimu: akiba ya kuweka tabaka (PLE), muundo wa MatFormer, na upakiaji wa kigezo cha masharti.

Hifadhi ya PLE: Kuvunja Mipaka ya Kumbukumbu

Hifadhi ya PLE ni utaratibu mahiri ambao unaruhusu mfumo kupakua vigezo vya kuweka tabaka kwenye kumbukumbu ya nje ya haraka, hivyo basi kupunguza matumizi ya kumbukumbu kwa kiasi kikubwa bila kuathiri utendaji. Vigezo hivi vinazalishwa nje ya kumbukumbu ya uendeshaji ya mfumo na kurejeshwa inavyohitajika wakati wa utekelezaji, hivyo basi kuwezesha uendeshaji bora hata kwenye vifaa vyenye rasilimali ndogo.

Fikiria unatumia mfumo changamano wa AI, lakini kifaa chako kina kumbukumbu ndogo. Hifadhi ya PLE inafanya kazi kama mtunza maktaba mahiri, akihifadhi vitabu (vigezo) visivyotumika mara kwa mara katika ghala lililo karibu (kumbukumbu ya nje). Wakati mfumo unahitaji vigezo hivi, mtunza maktaba anavirejesha haraka, na kuhakikisha kuwa mfumo unafanya kazi vizuri bila kuchukua nafasi muhimu ya kumbukumbu.

Hasa, hifadhi ya PLE huboresha matumizi na utendaji wa kumbukumbu kwa njia zifuatazo:

  • Kupunguza matumizi ya kumbukumbu: Kwa kuhifadhi vigezo visivyotumika mara kwa mara katika kumbukumbu ya nje, hifadhi ya PLE inaweza kupunguza kiwango cha kumbukumbu kinachohitajika na mfumo wakati wa utendaji. Hii inafanya uwezekano wa kuendesha mifumo mikubwa ya AI kwenye vifaa vyenye rasilimali chache.

  • Kuboresha utendaji: Ingawa kuchukua vigezo kutoka kwa kumbukumbu ya nje huchukua muda, hifadhi ya PLE hupunguza ucheleweshaji kwa kutabiri kwa werevu ni vigezo vipi vitatumika katika siku zijazo na kuvipakia kwenye hifadhi mapema. Hii inahakikisha kuwa mfumo unaweza kufanya kazi kwa kasi inayokaribia muda halisi.

  • Kusaidia mifumo mikubwa: Kwa kupunguza mahitaji ya kumbukumbu, hifadhi ya PLE inatuwezesha kujenga mifumo ya AI kubwa zaidi na changamano. Mifumo hii ina uwezo mkubwa wa kueleza na inaweza kukamilisha kazi ngumu zaidi.

Muundo wa MatFormer: Ubunifu wa Kirusi Kama wa Doll

Muundo wa Matryoshka Transformer (MatFormer) unaleta muundo uliounganishwa wa Transformer ambapo mifumo midogo imeingizwa kwenye mifumo mikubwa, sawa na dolls za Kirusi. Muundo huu unaruhusu uanzishaji wa kuchagua wa mifumo midogo, kuwezesha mfumo kurekebisha ukubwa wake na mahitaji ya hesabu kwa nguvu kulingana na kazi. Unyumbufu huu hupunguza gharama za kompyuta, nyakati za majibu, na matumizi ya nishati, na kuifanya kuwa bora kwa upelekaji wa ukingo na wingu.

Wazo kuu la muundo wa MatFormer ni kwamba sio kazi zote zinazohitaji mfumo kamili wa AI. Kwa kazi rahisi, mfumo mdogo tu unahitaji kuamilishwa, hivyo kuokoa rasilimali za kompyuta. Kwa kazi ngumu, mfumo mkubwa zaidi unaweza kuamilishwa ili kupata usahihi wa juu zaidi.

Hebu tueleze faida ya muundo wa MatFormer kwa mfano. Tuseme unatumia mfumo wa AI kutambua vitu kwenye picha. Kwa picha rahisi, kama vile picha iliyo na kitu kimoja tu, mfumo mdogo unaweza kuamilishwa, maalum katika kutambua aina hiyo maalum ya kitu. Kwa picha ngumu, kama vile picha iliyo na vitu vingi, mfumo mkubwa zaidi unaweza kuamilishwa, ambao una uwezo wa kutambua aina mbalimbali za vitu.

Faida za muundo wa MatFormer ni:

  • Kupunguza gharama za kompyuta: Kwa kuamilisha mifumo midogo tu inayohitajika, muundo wa MatFormer unaweza kupunguza gharama za kompyuta kwa kiasi kikubwa. Hii ni muhimu kwa kuendesha mifumo ya AI kwenye vifaa vyenye rasilimali chache.

  • Kufupisha nyakati za majibu: Kwa sababu muundo wa MatFormer unaweza kurekebisha ukubwa wa mfumo kwa nguvu kulingana na kazi, unaweza kufupisha nyakati za majibu. Hii inawezesha mfumo wa AI kujibu maombi ya mtumiaji kwa haraka zaidi.

  • Kupunguza matumizi ya nishati: Kwa kupunguza gharama za kompyuta, muundo wa MatFormer unaweza pia kupunguza matumizi ya nishati. Hii ni muhimu kwa kuongeza muda wa matumizi ya betri.

Upakiaji wa Kigezo cha Masharti: Upakiaji Unapohitajika, Uboreshaji wa Rasilimali

Upakiaji wa kigezo cha masharti huruhusu wasanidi programu kuruka kupakia vigezo ambavyo havitumiki (kama vile vigezo vya usindikaji wa sauti au taswira) kwenye kumbukumbu. Ikiwa ni lazima, vigezo hivi vinaweza kupakiwa kwa nguvu wakati wa utendaji, hivyo basi kuboresha zaidi matumizi ya kumbukumbu na kuwezesha mfumo kukabiliana na vifaa na kazi mbalimbali.

Fikiria unatumia mfumo wa AI kuchakata maandishi. Ikiwa kazi yako haihitaji usindikaji wowote wa sauti au taswira, basi kupakia vigezo vya usindikaji wa sauti au taswira itakuwa kupoteza rasilimali. Upakiaji wa kigezo cha masharti huruhusu mfumo kupakia tu vigezo vinavyohitajika, hivyo basi kupunguza matumizi ya kumbukumbu na kuboresha utendaji.

Upakiaji wa kigezo cha masharti hufanya kazi kama ifuatavyo:

  1. Mfumo huchanganua kazi ya sasa na kubaini vigezo vinavyohitajika.
  2. Mfumo hupakia tu vigezo vinavyohitajika kwenye kumbukumbu.
  3. Kazi inapokamilika, mfumo huachilia vigezo ambavyo havitumiki tena.

Faida za upakiaji wa kigezo cha masharti ni:

  • Uboreshaji wa matumizi ya kumbukumbu: Kwa kupakia tu vigezo vinavyohitajika, upakiaji wa kigezo cha masharti unaweza kuboresha matumizi ya kumbukumbu kwa kiasi kikubwa. Hii ni muhimu kwa kuendesha mifumo ya AI kwenye vifaa vyenye rasilimali chache.

  • Kuboresha utendaji: Kwa kupunguza idadi ya vigezo vilivyopakiwa, upakiaji wa kigezo cha masharti unaweza kuboresha utendaji. Hii inawezesha mfumo wa AI kujibu maombi ya mtumiaji kwa haraka zaidi.

  • Kusaidia vifaa mbalimbali zaidi: Kwa kuboresha matumizi ya kumbukumbu, upakiaji wa kigezo cha masharti hufanya iwezekanavyo kuendesha mifumo ya AI kwenye vifaa mbalimbali zaidi, ikiwa ni pamoja na vifaa vyenye kumbukumbu ndogo.

Sifa Bora za Gemma 3n

Gemma 3n inaleta teknolojia na vipengele vingi vya ubunifu ambavyo vinafafanua upya uwezekano wa AI kwenye kifaa.

Hebu tuangalie kwa undani vipengele vyake muhimu:

  1. Utendaji na ufanisi ulioboreshwa wa kifaa: Gemma 3n ni takriban mara 1.5 haraka kuliko mtangulizi wake (Gemma 3 4B), huku ikiendelea kudumisha ubora wa utoaji wa juu zaidi. Hii inamaanisha unaweza kupata matokeo sahihi zaidi kwenye kifaa chako haraka zaidi, bila kulazimika kutegemea muunganisho wa wingu.

  2. Hifadhi ya PLE: Mfumo wa hifadhi wa PLE huwezesha Gemma 3n kuhifadhi kigezo katika kumbukumbu ya ndani ya haraka, hivyo kupunguza kumbukumbu na kuboresha perfomance.

  3. Usanifu wa MatFormer: Gemma 3n hutumia usanifu wa MatFormer, unaochagua kuchagua vipimo vya mfumo. Hii huwezesha mfumo kurekebisha vipimo vyake na mahitaji ya kompyuta, kutengeneza matumizi ya raslimali iliyo bora.

  4. **Upakiaji wa kigezo cha masharti:**Ili kuokoa rasilimali za kumbukumbu, Gemma 3n inaweza kupita kupakia vipimo ambavyo sio vya lazima, kwa mfano wakati hauhitaji taswira au sauti, inaweza kutopakia vipimo sambamba. Hii zaidi inazidisha ufanisi na kupunguza matumizi ya nguvu.

  5. Ubora wa siri na utayari wa mtandao: Hakuna haja ya internet kwa kufanya AI ifanye kazi, kuhakikisha siri ya mtumiaji. Hii inamaanisha data yako haiachi kifaa chako, na unaweza tumia kazi za AI pasipo na utume wa mtandao.

  6. Uelewaji wa mfumo wa aina nyingi: Gemma 3n huandaa usaidizi mkuu kwa sauti, matini, taswira, na ingizo ya video, kutengeneza mwingiliano wa aina aingi wa mfumo. Hii huwezesha mfumo wa AI kuelewa na kujibu aina mbalimbali za ingizo, kutengeneza matumizi iliyo rahisi na moja kwa moja.

  7. Ufanya kazi wa sauti: Hutoa utambuzi wa sauti wa moja kwa moja(ASR) na utafsiri wa sauti kwa matini, ulio na ubora mzuri wa kuandika na usaidizi wa lugha nyingi. Hii inamaanisha unaweza tumia Gemma 3n kubadlisha maneno yaliyozungumzwa kwenda kwa matini, na utafsiri wa sauti kwenda lugha nyingine.

  8. Uboreshaji wa uwezo wa lugha nyingi: Uboreshaji mkubwa umebainishwa kwa lugha za Kijapani, kijerumani, Kikorea, Kihispania na Kifaransa. Hii inamaanisha Gemma 3n inaweza kuelewa zaidi na kutengeneza matini za lugha mbalimbali.

  9. kikomo cha alama 32K: Inaweza kuchukua vipimo vingi kwenye ombi moja, itengeneza majadiliano marefu na kazi ngumu. Hii inamaanisha unaweza kuandaa Gemma 3n kwa ingizo ya matini ndefu pasipo na wasiwasi wa kupita kikomo cha mfumo.

Anza haraka na Gemma 3n

Kuanza na Gemma 3n ni rahisi kabisa, wasanidi programu wanaweza chunguza na kutengeneza vipimo mbalimbali vya mfumo huu.

1. Google AI Studio: Tengeneza mfumo rahisi kabla mfumo bora

Ingia kwa Google AI Studio, nenda kwenye studio, chagua Gemma 3n E4BMfumo, na ndipo unaweza kuanza kutengeneza Vipimo vya Gemma 3n. Studio hii inafaa kwa wasanidi programu kuanza kujenga mfumo rahisi kabla kujenga kiunzi, na kujaribu mawazo kwa haraka.

Unaweza pata ufunguo ya API, na utengenezee Mfumo kwa roboti za AI, haswa kupitia Msty Matumizi.

Zaidi ya hayo, unaweza tumia Google GenAI Python SDK, vipengele vichache tu unaweza tengenezea Mfumo kwa matumizi yako. Hii inatengeneza utengenezaji wa Gemma 3n kwa mfumo wako iwe ngumu.

2. Tumia Google AI Edge kufanyia kazi kifaa: Jenga matumizi ya ndani

Kwa wasanidi programu kuwa tayari kutengeneza Gemma 3n moja kwa moja kwa matumizi, Google AI edge huandaa zana kwa Andoid na vifaa za Chrome kufanyia kazi kifaa. Njia hii inafaa kujenga matumizi ya ndani ukitumia vipimo vya Gemma 3n.

Google AI edge huandaa zana mbalimbali kwa programu.

  • TensorFlow Lite: kwa kuendesha mfumo wa AI kwneye Kifaa cha mkononi.
  • ML Kit: Mkusanyiko API kwa Kuongeza vipimo vya kujifunza kwa matumizi ya simu.
  • Android Neural Networks API (NNAPI): kwa kuendesha mfumo wa AI kwa utumiaji wa kifaa cha ndani.

Kwa tumia Google AI Edge, unaweza kufanya au kujenga Vipimo mbalimbali vya ubunifu.

  • Utambuzi wa Sauti ya Mtandao: Kuruhusu watumiaji tumia maagizo ya mtandao kwa Kuendesha vifaa.
  • Utambulisho Halisi wa Picha: kuruhusu watumiaji kutambulisha vipimo bila kuhitajika kupakia picha kwa Mtandao.
  • Utengenezaji wa matini: kuruhusu watumiaji kutengenza aina mbalimbali za matini.