Ironwood, kitengo kipya cha Google cha Tensor Processing (TPU), kimeleta mabadiliko makubwa katika uwanja wa uchakataji wa akili bandia (AI). Kiongeza kasi hiki cha AI kina uwezo wa kikokotozi ambao, katika upelekaji mkubwa, unazidi superkompyuta iliyo ya haraka zaidi duniani kwa zaidi ya mara 24.
Chip hii mpya, iliyoonyeshwa katika mkutano wa Google Cloud Next ‘25, inaashiria hatua muhimu katika mkakati wa Google wa muongo mmoja katika ukuzaji wa chipu za AI. Tofauti na vizazi vyake vilivyotangulia, ambavyo vilikusudiwa kimsingi kwa mafunzo ya AI na mzigo wa kazi wa uwezeshaji, Ironwood imeundwa mahsusi kwa uwezeshaji, ikionyesha mabadiliko ya kimkakati kuelekea kuboresha ufanisi wa upelekaji wa AI.
Amin Vahdat, Makamu wa Rais wa Google na Meneja Mkuu wa Kujifunza kwa Mashine, Mifumo na Wingu AI, alisisitiza mabadiliko haya, akisema, ‘Ironwood imeundwa kusaidia awamu inayofuata ya AI generetaivu na mahitaji yake makubwa ya hesabu na mawasiliano. Hii ndio tunaita ‘Enzi ya Uwezeshaji,’ ambapo mawakala wa AI watapata na kutoa data kikamilifu ili kutoa maarifa na majibu kwa ushirikiano, badala ya kuchakata data tu.’
Kuvunja Vizuizi kwa Nguvu ya Kikokotozi ya 42.5 Exaflops
Maelezo ya kiufundi ya Ironwood yanavutia kweli. Inapoongezwa kwa podi ya chips 9,216, inatoa exaflops 42.5 za ajabu za hesabu za AI. Ili kuweka hii katika mtazamo, inazidi superkompyuta ya sasa ya haraka zaidi duniani, El Capitan, ambayo inafanya kazi kwa exaflops 1.7. Kila chipu ya Ironwood inaweza kufikia uwezo wa kilele wa hesabu wa 4614 TFLOPs.
Zaidi ya nguvu ya uchakataji mbichi, Ironwood inaboresha sana kumbukumbu na bandwidth. Kila chipu ina vifaa vya 192GB vya kumbukumbu ya bandwidth ya juu (HBM), ongezeko la mara sita ikilinganishwa na kizazi kilichopita cha TPU, Trillium, iliyotolewa mwaka jana. Bandwidth ya kumbukumbu kwa kila chipu inafikia terabits 7.2/s, mara 4.5 zaidi ya Trillium.
- Nguvu ya Kikokotozi: exaflops 42.5 (kwa kila podi ya chips 9,216)
- Kikokotozi cha Kilele kwa Chipu: 4614 TFLOPs
- Kumbukumbu: 192GB HBM kwa kila chipu
- Bandwidth ya Kumbukumbu: terabits 7.2/s kwa kila chipu
Katika enzi ambapo vituo vya data vinapanuka na matumizi ya nishati yanaongezeka, Ironwood pia inaonyesha maboresho makubwa katika ufanisi wa nishati. Inatoa utendaji mara mbili kwa kila wati ikilinganishwa na Trillium na karibu mara 30 kuliko TPU ya kwanza iliyoanzishwa mwaka 2018.
Uboreshaji huu wa uwezeshaji unaashiria hatua muhimu katika mageuzi ya AI. Katika miaka ya hivi karibuni, maabara zinazoongoza za AI zimezingatia ukuzaji wa modeli kubwa zinazoongezeka na hesabu zinazoongezeka za vigezo. Mtazamo wa Google kwenye uboreshaji wa uwezeshaji unaashiria hoja kuelekea dhana mpya inayozingatia ufanisi wa upelekaji na uwezo wa uwezeshaji.
Wakati mafunzo ya modeli yanabaki kuwa muhimu, shughuli za uwezeshaji ni za mara kwa mara zaidi, zikitokea mabilioni ya mara kila siku wakati teknolojia za AI zinakuwa pana zaidi. Kwa biashara zinazotumia AI, uchumi unahusiana kwa asili na gharama za uwezeshaji wakati modeli zinakuwa ngumu zaidi.
Mahitaji ya hesabu ya AI ya Google yameongezeka mara kumi katika miaka minane iliyopita, na kufikia milioni 100 za kushangaza. Bila usanifu maalum kama Ironwood, ingekuwa haiwezekani kuendeleza mwelekeo huu wa ukuaji kupitia maendeleo ya jadi katika Sheria ya Moore pekee.
Hasa, tangazo la Google lilionyesha umakini kwenye ‘modeli za hoja’ zenye uwezo wa kutekeleza kazi ngumu za uwezeshaji badala ya utambuzi rahisi wa muundo. Hii inaashiria imani kwamba mustakabali wa AI hauko tu katika modeli kubwa lakini pia katika modeli zenye uwezo wa kuvunja matatizo, kushiriki katika hoja za hatua nyingi, na kuiga michakato ya mawazo kama ya binadamu.
Kuwezesha Modeli Kubwa za Kizazi Kijacho
Google inaiweka Ironwood kama miundombinu ya msingi kwa modeli zake za juu zaidi za AI, pamoja na Gemini 2.5 yake, ambayo inajivunia ‘uwezo wa asili wa hoja.’
Hivi majuzi kampuni hiyo pia ilianzisha Gemini 2.5 Flash, toleo dogo la modeli yake ya bendera iliyoundwa ‘kurekebisha kina cha hoja kulingana na ugumu wa haraka.’ Modeli hii imeelekezwa kwa programu za kila siku zinazohitaji nyakati za majibu ya haraka.
Google zaidi ilionyesha safu yake kamili ya modeli za kizazi za multimodal, inayojumuisha maandishi-kwa-picha, maandishi-kwa-video, na uwezo wake mpya uliowekwa wazi wa maandishi-kwa-muziki, Lyria. Onyesho lilionyesha jinsi zana hizi zinaweza kuunganishwa ili kuunda video kamili ya ukuzaji wa tamasha.
Ironwood ni sehemu moja tu ya mkakati mpana wa miundombinu ya AI wa Google. Kampuni pia ilitangaza Cloud WAN, huduma inayosimamiwa ya mtandao wa eneo pana ambayo inapeana biashara ufikiaji wa miundombinu ya mtandao ya kibinafsi ya kiwango cha ulimwengu ya Google.
Google pia inapanua matoleo yake ya programu kwa mzigo wa kazi wa AI, pamoja na Pathways, utendaji wa kujifunza kwa mashine uliotengenezwa na Google DeepMind. Pathways sasa inaruhusu wateja kupima upelekaji wa modeli kwenye mamia ya TPU.
Kuanzisha A2A: Kukuza Mfumo wa Ikolojia wa Ushirikiano wa Wakala Mahiri
Zaidi ya maendeleo ya maunzi, Google ilitoa maono yake kwa AI iliyozingatia mifumo ya mawakala wengi, ikifunua itifaki ya kuwezesha ukuzaji wa mawakala mahiri: Wakala-kwa-Wakala (A2A). Itifaki hii imeundwa kukuza mawasiliano salama na sanifu kati ya mawakala tofauti wa AI.
Google inaamini kuwa 2025 itaashiria mwaka wa mabadiliko kwa AI, na utumiaji wa AI generetaivu unaobadilika kutoka kujibu maswali moja hadi kutatua matatizo magumu kupitia mifumo mahiri ya wakala.
Itifaki ya A2A inawezesha utangamano katika majukwaa na mifumo, ikipeana mawakala ‘lugha’ ya kawaida na njia salama za mawasiliano. Itifaki hii inaweza kutazamwa kama safu ya mtandao kwa mawakala mahiri, inayolenga kurahisisha ushirikiano wa wakala katika utendaji kazi tata. Inawawezesha mawakala maalum wa AI kufanya kazi pamoja kwenye kazi za ugumu na muda tofauti, hatimaye ikiboresha uwezo wa jumla kupitia ushirikiano.
Jinsi A2A Inavyofanya Kazi
Google ilitoa ulinganisho kati ya itifaki za MCP na A2A katika chapisho lake la blogu:
- MCP (Itifaki ya Muktadha wa Modeli): Kwa usimamizi wa zana na rasilimali
- Huunganisha mawakala kwenye zana, API, na rasilimali kupitia ingizo/towe iliyoandaliwa.
- Google ADK inasaidia zana za MCP, ikiwezesha seva mbalimbali za MCP kufanya kazi na mawakala.
- A2A (Itifaki ya Wakala2Wakala): Kwa ushirikiano kati ya mawakala
- Huwezesha mawasiliano ya multimodal yenye nguvu kati ya mawakala bila kushiriki kumbukumbu, rasilimali, au zana.
- Kiwango kilicho wazi kinachoendeshwa na jumuiya.
- Mifano inaweza kutazamwa kwa kutumia zana kama Google ADK, LangGraph, na Crew.AI.
Kimsingi, A2A na MCP zinakamilishana. MCP inapeana mawakala msaada wa zana, wakati A2A inaruhusu mawakala hawa walio na vifaa kuwasiliana na kushirikiana na kila mmoja.
Orodha ya washirika iliyotangazwa na Google inaashiria kuwa A2A iko tayari kupokea umakini sawa na MCP. Mpango huo tayari umevutia zaidi ya kampuni 50 kwa kundi lake la awali la ushirikiano, pamoja na kampuni zinazoongoza za teknolojia na watoaji wa huduma za ushirikiano na ujumuishaji wa mfumo wa kimataifa wa juu.
Google ilisisitiza ufunguzi wa itifaki hiyo, ikiiiweka kama njia sanifu kwa mawakala kushirikiana, bila kujali mifumo ya teknolojia ya msingi au watoaji wa huduma. Kampuni ilisema kwamba ilifuata kanuni tano muhimu zifuatazo wakati wa kubuni itifaki na washirika wake:
- Kumbatia Uwezo wa Wakala: A2A inazingatia kuwezesha mawakala kushirikiana katika njia zao za asili, ambazo hazijaandaliwa, hata kama hawashiriki kumbukumbu, zana, na muktadha. Lengo ni kuwezesha matukio halisi ya mawakala wengi bila kuwazuia mawakala kwenye ‘zana’ tu.
- Jenga Juu ya Viwango Vilivyopo: Itifaki hiyo inajengwa juu ya viwango maarufu vilivyopo, pamoja na HTTP, SSE, na JSON-RPC, ikifanya iwe rahisi kuunganishwa na vifurushi vilivyopo vya IT vinavyotumiwa na biashara.
- Salama kwa Chaguomsingi: A2A imeundwa kusaidia uthibitishaji na uidhinishaji wa kiwango cha biashara, kulinganishwa na miradi ya uthibitishaji ya OpenAPI wakati wa uzinduzi.
- Saidia Kazi Zinazoendesha kwa Muda Mrefu: A2A imeundwa kwa unyumbufu kusaidia anuwai ya matukio, kutoka kwa kazi za haraka hadi utafiti wa kina ambao unaweza kuchukua masaa au hata siku (wakati wanadamu wanahusika). Katika mchakato wote, A2A inaweza kuwapa watumiaji maoni ya wakati halisi, arifa, na sasisho za hali.
- Modality Agnostic: Ulimwengu wa mawakala hauzuiliwi kwa maandishi, ndiyo sababu A2A imeundwa kusaidia njia anuwai, pamoja na mitiririko ya sauti na video.
Mfano: Mchakato Uliorahisishwa wa Kuajiri kupitia A2A
Mfano uliotolewa na Google unaonyesha jinsi A2A inaweza kurahisisha sana mchakato wa kuajiri.
Ndani ya kiolesura kilichounganishwa kama Agentspace, meneja wa kuajiri anaweza kumpa wakala kupata wagombea wanaofaa kulingana na mahitaji ya kazi. Wakala huyu anaweza kuingiliana na mawakala maalum katika nyanja maalum kukamilisha upataji wa mgombea. Mtumiaji anaweza pia kumwagiza wakala kupanga ratiba za mahojiano na kuwezesha mawakala wengine maalum kusaidia na ukaguzi wa asili, na hivyo kuwezesha uajiri wa ushirikiano otomatiki kikamilifu wa mifumo mbalimbali.
Kukumbatia MCP: Kujiunga na Mfumo wa Ikolojia wa Itifaki ya Muktadha wa Modeli
Wakati huo huo, Google pia inakumbatia MCP. Wiki chache tu baada ya OpenAI kutangaza kupitishwa kwa Itifaki ya Muktadha wa Modeli (MCP) ya Anthropic, Google ilifuata nyayo na kujiunga na mpango huo.
Mkurugenzi Mtendaji wa Google DeepMind, Demis Hassabis alitangaza kwenye X kwamba Google itaongeza msaada kwa MCP kwa modeli na SDK zake za Gemini, ingawa ratiba maalum haikutolewa.
Hassabis alisema, ‘MCP ni itifaki bora ambayo inakuwa haraka kiwango kilicho wazi kwa enzi ya mawakala wa AI. Tunatazamia kufanya kazi na timu ya MCP na washirika wengine katika tasnia kuendeleza ukuzaji wa teknolojia hii.’
Tangu kutolewa kwake mnamo Novemba 2024, MCP imepata haraka umaarufu na umakini mkubwa, ikiibuka kama njia rahisi na sanifu ya kuunganisha modeli za lugha na zana na data.
MCP inawezesha modeli za AI kufikia data kutoka kwa vyanzo vya data kama vile zana za biashara na programu kukamilisha kazi na kufikia maktaba za yaliyomo na mazingira ya ukuzaji wa programu. Itifaki hiyo inaruhusu wasanidi kuanzisha miunganisho ya pande mbili kati ya vyanzo vya data na programu zinazoendeshwa na AI, kama vile chatbots.
Wasanidi wanaweza kufichua violesura vya data kupitia seva za MCP na kuunda wateja wa MCP (kama vile programu na utendaji kazi) kuungana na seva hizi. Tangu Anthropic ianzishe MCP kwa chanzo wazi, kampuni kadhaa zimejumuisha msaada wa MCP kwenye majukwaa yao.
Uchambuzi Ulioimarishwa wa Dhana Muhimu:
Ili kufafanua zaidi athari na umuhimu wa matangazo ya hivi karibuni ya Google, hebu tuzame zaidi kwenye vipengele vya msingi: Ironwood, A2A, na MCP.
Ironwood: Mzamiaji Mkuu katika Enzi ya Uwezeshaji
Mabadiliko kutoka kuzingatia kimsingi modeli za mafunzo hadi kuboresha uwezeshaji ni mageuzi muhimu katika mandhari ya AI. Mafunzo yanahusisha kulisha idadi kubwa ya data kwa modeli ili kuifundisha kutambua mifumo na kufanya utabiri. Uwezeshaji, kwa upande mwingine, ni mchakato wa kutumia modeli iliyofunzwa kufanya utabiri kwenye data mpya, isiyoonekana.
Wakati mafunzo ni tukio la matumizi makubwa ya rasilimali, la mara moja (au lisilo la mara kwa mara), uwezeshaji hutokea kila marana kwa kiwango kikubwa katika programu za ulimwengu halisi. Fikiria programu kama:
- Chatbots: Kujibu maswali ya watumiaji katika wakati halisi.
- Mifumo ya Mapendekezo: Kupendekeza bidhaa au maudhui kulingana na mapendeleo ya watumiaji.
- Ugunduzi wa Ulaghai: Kutambua miamala ya ulaghai inapotokea.
- Utambuzi wa Picha: Kuchambua picha kutambua vitu, watu, au mandhari.
Programu hizi zinahitaji uwezeshaji wa haraka na bora ili kutoa uzoefu usio na mshono wa mtumiaji. Ironwood imeundwa mahsusi ili kufanya vizuri katika kazi hizi.
Faida Muhimu za Ironwood kwa Uwezeshaji:
- Ufanisi Mkubwa: Nguvu kubwa ya hesabu (exaflops 42.5) inaruhusu Ironwood kushughulikia idadi kubwa ya maombi ya uwezeshaji kwa wakati mmoja.
- Latency ya Chini: Kumbukumbu ya bandwidth ya juu (HBM) na usanifu bora hupunguza muda unaochukua kuchakata kila ombi la uwezeshaji.
- Ufanisi wa Nishati: Utendaji ulioboreshwa kwa kila wati hupunguza gharama za uendeshaji zinazohusiana na kuendesha upelekaji wa uwezeshaji kwa kiwango kikubwa.
Kwa kuboresha uwezeshaji, Google inawezesha biashara kupeleka programu zinazoendeshwa na AI kwa ufanisi zaidi na kwa gharama nafuu.
A2A: Msingi wa AI ya Ushirikiano
Itifaki ya Wakala-kwa-Wakala (A2A) inawakilisha hatua muhimu kuelekea kuunda mifumo ya AI ya kisasa na ya ushirikiano zaidi. Katika mfumo wa mawakala wengi, mawakala kadhaa wa AI hufanya kazi pamoja ili kutatua tatizo ngumu. Kila wakala anaweza kuwa na ujuzi na maarifa yake maalum, na wanawasiliana na kuratibu na kila mmoja ili kufikia lengo la pamoja.
Fikiria hali inayohusisha msaada wa kiotomatiki wa wateja:
- Wakala 1: Huelewa swali la awali la mteja na hutambua suala la msingi.
- Wakala 2: Hufikia msingi wa maarifa kupata habari muhimu.
- Wakala 3: Hupanga ratiba ya miadi ya ufuatiliaji na wakala wa kibinadamu ikiwa ni lazima.
Mawakala hawa wanahitaji kuweza kuwasiliana na kushiriki habari kwa urahisi ili kutoa uzoefu thabiti wa mteja. A2A hutoa mfumo wa aina hii ya ushirikiano.
Faida Muhimu za A2A:
- Uwezo wa Kufanya Kazi Pamoja: Inaruhusu mawakala waliotengenezwa kwenye majukwaa na mifumo tofauti kuwasiliana na kila mmoja.
- Uthibitishaji: Hutoa ‘lugha’ ya kawaida na seti ya itifaki za mawasiliano ya wakala.
- Usalama: Inahakikisha mawasiliano salama kati ya mawakala, kulinda data nyeti.
- Unyumbufu: Inasaidia anuwai ya njia za mawasiliano, pamoja na maandishi, sauti, na video.
Kwa kukuza ushirikiano kati ya mawakala wa AI, A2A inawezesha ukuzaji wa mifumo ya AI yenye nguvu na anuwai zaidi.
MCP: Kuziba Pengo Kati ya AI na Data
Itifaki ya Muktadha wa Modeli (MCP) inashughulikia changamoto ya kuunganisha modeli za AI na idadi kubwa ya data inayohitajika kufanya kazi zao kwa ufanisi. Modeli za AI zinahitaji kufikia data ya wakati halisi kutoka kwa vyanzo anuwai, kama vile hifadhidata, API, na huduma za wingu, kufanya utabiri sahihi na maamuzi sahihi.
MCP hutoa njia sanifu kwa modeli za AI kufikia na kuingiliana na vyanzo hivi vya data. Inafafanua seti ya itifaki za:
- Ugunduzi wa Data: Kutambua vyanzo vya data vinavyopatikana.
- Ufikiaji wa Data: Kupata data kutoka kwa vyanzo vya data.
- Mabadiliko ya Data: Kubadilisha data kuwa fomati ambayo modeli ya AI inaweza kuelewa.
Kwa kutoa kiolesura sanifu cha ufikiaji wa data, MCP hurahisisha mchakato wa kuunganisha modeli za AI na data ya ulimwengu halisi.
Faida Muhimu za MCP:
- Ujumuishaji Uliorahisishwa: Hufanya iwe rahisi kuunganisha modeli za AI na vyanzo vya data.
- Uthibitishaji: Hutoa seti ya kawaida ya itifaki za ufikiaji wa data.
- Ufanisi Ulioongezeka: Hupunguza muda na juhudi zinazohitajika kufikia na kubadilisha data.
- Usahihi Ulioboreshwa: Huwezesha modeli za AI kufikia habari iliyo mpya zaidi, na kusababisha utabiri sahihi zaidi.
Kwa kuunganisha modeli za AI na data wanayohitaji, MCP inawawezesha kufanya kazi kwa ufanisi zaidi na kutoa thamani kubwa.