Ironwood TPU ya Google: Rukia Kubwa katika Nguvu ya Kompyuta ya AI
Mandhari ya akili bandia (AI) imefafanuliwa upya na uzinduzi wa Google wa kizazi chake cha saba cha Tensor Processing Unit (TPU), kilichopewa jina Ironwood. Kiongeza kasi hiki cha AI kinajivunia uwezo wa kompyuta ambao unazidi hata superkompyuta zenye nguvu zaidi ulimwenguni. Katika usanidi mkubwa, uwezo wa Ironwood unazidi ule wa superkompyuta ya haraka zaidi kwa mara 24.
Uzinduzi wa Ironwood katika hafla ya Google Cloud Next ‘25 unaashiria wakati muhimu katika harakati ya Google ya miongo kumi ya uvumbuzi wa chipu za AI. Ingawa matoleo ya awali ya TPU yalishughulikia hasa kazi za mafunzo na inference za miundo ya AI, Ironwood inasimama kama chipu ya kwanza iliyoundwa kwa uangalifu na kuboreshwa kwa kazi za inference.
Kulingana na Amin Vahdat, Makamu wa Rais na Meneja Mkuu wa Machine Learning, Systems, na Cloud AI katika Google, ‘Ironwood imeundwa kuendeleza awamu inayofuata ya generative AI, kushughulikia mahitaji yake makubwa ya kompyuta na mawasiliano. Tunaingia katika kile tunachokiita ‘Enzi ya Inference,’ ambapo mawakala wa AI watakuwa wakikumbuka na kutoa data kwa ushirikiano ili kutoa ufahamu na majibu, kuzidi uwezo wa usindikaji wa data tu.’
Kufungua Nguvu Isiyo na Kifani ya Kompyuta: Kuzama katika Uwezo wa Ironwood
Vipimo vya kiufundi vya Ironwood vinasomeka kama orodha ya matakwa kwa watafiti na watengenezaji wa AI. Kuongezeka hadi podi ya chipu 9,216, Ironwood hutoa exaflops 42.5 za kushangaza za kompyuta ya AI. Ili kuweka hili katika mtazamo, inazidi sana uwezo wa bingwa wa sasa wa superkompyuta, El Capitan, ambayo ina kilele cha exaflops 1.7. Kibinafsi, kila chipu ya Ironwood inajivunia uwezo wa kilele cha kompyuta cha 4614 TFLOPs.
Zaidi ya nguvu ya usindikaji mbichi, Ironwood inaleta maboresho makubwa katika kumbukumbu na bandwidth. Kila chipu ina vifaa vya 192GB ya High Bandwidth Memory (HBM), ongezeko la mara sita ikilinganishwa na kizazi kilichopita cha TPU, Trillium. Bandwidth ya kumbukumbu pia imeboreshwa sana, ikifikia 7.2 terabits/s kwa kila chipu, mara 4.5 ile ya Trillium.
Katika enzi ambapo vituo vya data vinaongezeka na matumizi ya nguvu yanazidi kuwa jambo muhimu, Ironwood inaonyesha ufanisi mkubwa wa nishati. Utendaji wake kwa wati ni mara mbili ya Trillium na karibu mara 30 bora kuliko TPU ya awali iliyoanzishwa mwaka 2018.
Mabadiliko haya kuelekea uboreshaji wa inference yanawakilisha hatua muhimu katika mageuzi ya AI. Katika miaka ya hivi karibuni, maabara zinazoongoza za AI zimezingatia kujenga miundo ya msingi na idadi ya vigezo vinavyoendelea kupanuka. Mkazo wa Google juu ya uboreshaji wa inference unaashiria mabadiliko kuelekea kuweka kipaumbele ufanisi wa upelekaji na uwezo wa inference wa ulimwengu halisi.
Wakati mafunzo ya miundo ya AI ni shughuli isiyo ya kawaida, shughuli za inference hutokea mabilioni ya mara kila siku wakati teknolojia za AI zinakuwa zimeenea zaidi. Ufadhili wa kiuchumi wa biashara zinazoendeshwa na AI umeunganishwa kimsingi na gharama za inference, haswa kadri miundo inavyozidi kuwa ngumu.
Katika kipindi cha miaka minane iliyopita, mahitaji ya Google ya kompyuta ya AI yameongezeka kwa kasi, ikiongezeka mara kumi na kufikia milioni 100 za kushangaza. Bila usanifu maalum kama Ironwood, Sheria ya Moore pekee haiwezi kuendeleza mwelekeo huu wa ukuaji.
Mkazo wa Google juu ya ‘miundo ya hoja’ yenye uwezo wa kazi ngumu za inference, badala ya utambuzi rahisi wa muundo, ni muhimu sana. Hii inaonyesha kwamba Google inawazia siku zijazo ambapo AI haitafanikiwa tu kupitia miundo mikubwa lakini pia kupitia miundo yenye uwezo wa kuvunja matatizo, kufanya hoja za hatua nyingi, na kuiga michakato ya mawazo kama ya binadamu.
Kuwezesha Kizazi Kinachofuata cha Miundo Mikubwa ya Lugha
Google inaweka Ironwood kama miundombinu ya msingi kwa miundo yake ya hali ya juu zaidi ya AI, pamoja na Gemini 2.5, ambayo inajivunia ‘uwezo wa asili wa hoja.’
Pamoja na Ironwood, Google ilizindua Gemini 2.5 Flash, toleo lililorahisishwa la muundo wake mkuu iliyoundwa kwa ajili ya programu nyeti za latency, za kila siku. Gemini 2.5 Flash inaweza kurekebisha kwa nguvu kina chake cha hoja kulingana na utata wa kidokezo.
Google pia ilionyesha suite yake ya miundo ya generative ya multimodal, inayojumuisha maandishi-kwa-picha, maandishi-kwa-video, na utendaji mpya ulioanzishwa wa maandishi-kwa-muziki, Lyria. Onyesho la kuvutia lilionyesha jinsi zana hizi zinaweza kuunganishwa ili kutoa video kamili ya matangazo ya tamasha.
Ironwood ni sehemu moja tu ya mkakati kamili wa miundombinu ya AI wa Google. Kampuni hiyo pia ilianzisha Cloud WAN, huduma ya mtandao mpana inayosimamiwa ambayo inawezesha biashara kugonga miundombinu ya mtandao wa kibinafsi wa kiwango cha kimataifa cha Google.
Google pia inapanua matoleo yake ya programu kwa kazi za AI, pamoja na Pathways, runtime ya kujifunza mashine iliyotengenezwa na Google DeepMind, ambayo inaruhusu wateja kupanua utoaji wa muundo katika mamia ya TPU.
Maono ya Akili ya Ushirikiano: Kuanzisha Msaada wa A2A na MCP
Zaidi ya maendeleo ya vifaa, Google ilieleza maono yake ya AI yaliyozingatia mifumo ya mawakala wengi na ilianzisha itifaki ya Agent-to-Agent (A2A), iliyoundwa ili kukuza mawasiliano salama na sanifu kati ya mawakala mbalimbali wa AI.
Google inatarajia 2025 kama mwaka wa mabadiliko kwa AI, na programu za generative AI zinabadilika kutoka kujibu maswali moja hadi kutatua matatizo magumu kupitia mifumo ya mawakala iliyounganishwa.
Itifaki ya A2A inawezesha ushirikiano kwenye majukwaa na mifumo, kuwapa mawakala wa AI ‘lugha’ ya kawaida na njia salama za mawasiliano. Fikiria kama safu ya mtandao kwa mawakala wa AI, kurahisisha ushirikiano katika mtiririko wa kazi ngumu na kuwezesha mawakala maalum wa AI kushughulikia kwa pamoja kazi za utata na muda tofauti, na hivyo kuongeza uwezo wa jumla kupitia ushirikiano.
Jinsi A2A Inavyofanya Kazi
Google imetoa muhtasari wa kulinganisha wa itifaki za MCP na A2A:
- MCP (Model Context Protocol): Inalenga usimamizi wa zana na rasilimali.
- Inaunganisha mawakala na zana, API, na rasilimali kupitia ingizo/towe lililoandaliwa.
- Google ADK inasaidia zana za MCP, kuwezesha mwingiliano usio na mshono kati ya seva za MCP na mawakala.
- A2A (Agent2Agent Protocol): Inawezesha ushirikiano kati ya mawakala.
- Inawezesha mawasiliano ya nguvu, ya multimodal kati ya mawakala bila kuhitaji kumbukumbu, rasilimali, au zana zilizoshirikiwa.
- Ni kiwango wazi kinachoendeshwa na jumuiya.
- Mifano inaweza kuchunguzwa kwa kutumia zana kama vile Google ADK, LangGraph, na Crew.AI.
A2A na MCP zinakamilishana. MCP inaweka mawakala na zana, wakati A2A inawezesha mawakala hawa walio na vifaa kuzungumza na kushirikiana.
Orodha ya awali ya washirika wa Google inapendekeza kwamba A2A iko tayari kupokea umakini sawa na MCP. Mpango huo tayari umevutia mashirika zaidi ya 50, pamoja na kampuni zinazoongoza za teknolojia na watoa huduma wa ushauri na ujumuishaji wa mifumo wa kimataifa.
Google inasisitiza uwazi wa itifaki hiyo, ikiweka kama kiwango cha ushirikiano kati ya mawakala kinachozidi mifumo ya msingi ya teknolojia au watoa huduma. Google ilionyesha kanuni tano za msingi ambazo ziliunda muundo wa itifaki:
- Kukumbatia Uwezo wa Wakala: A2A inatanguliza kuwezesha mawakala kushirikiana kiasili, hata bila kushiriki kumbukumbu, zana, au muktadha. Lengo ni kuwezesha matukio ya kweli ya mawakala wengi, sio kuwazuia tu mawakala kufanya kazi kama ‘zana.’
- Kujenga juu ya Viwango Vilivyopo: Itifaki inatumia viwango vilivyopo, vilivyopitishwa sana, pamoja na HTTP, SSE, na JSON-RPC, kurahisisha ujumuishaji na IT stacks zilizopo.
- Salama kwa Chaguomsingi: A2A imeundwa kusaidia uthibitishaji na idhini ya kiwango cha biashara, inayolingana na mipango ya uthibitishaji ya OpenAPI.
- Kusaidia Kazi za Muda Mrefu: Unyumbufu wa A2A inaruhusu kusaidia aina mbalimbali za matukio, kutoka kwa kazi za haraka hadi utafiti wa kina ambao unaweza kuchukua masaa au hata siku (hasa wakati ushiriki wa binadamu unahitajika). Katika mchakato wote, A2A inaweza kuwapa watumiaji maoni ya wakati halisi, arifa, na sasisho za hali.
- Modality Agnostic: Kutambua kwamba ulimwengu wa mawakala unaenea zaidi ya maandishi, A2A inasaidia aina mbalimbali, ikiwa ni pamoja na mito ya sauti na video.
Google ilitoa mfano wa jinsi A2A inavyorahisisha mchakato wa kuajiri.
Katika interface iliyounganishwa kama Agentspace, meneja wa kuajiri anaweza kumpa wakala kutambua wagombea wanaofaa kulingana na mahitaji ya kazi. Wakala huyu anaweza kuingiliana na mawakala maalum ili kupata wagombea. Watumiaji wanaweza pia kuwaagiza mawakala kuratibu mahojiano na kuwashirikisha mawakala wengine maalum kusaidia na ukaguzi wa asili, kuwezesha uajiri wa kiotomatiki na wenye akili katika mifumo.
Kukumbatia Model Context Protocol (MCP)
Google pia inakumbatia MCP. Muda mfupi baada ya OpenAI kutangaza kupitishwa kwake kwa Anthropic’s Model Context Protocol (MCP), Google ilifuata mfano huo.
Demis Hassabis, CEO wa Google DeepMind, alitangaza kwenye X (zamani Twitter) kwamba Google ingeongeza msaada kwa MCP katika miundo yake ya Gemini na SDK, ingawa hakutoa ratiba maalum.
Hassabis alisema kwamba ‘MCP ni itifaki bora ambayo inakuwa haraka kiwango wazi kwa umri wa mawakala wa AI. Tunatarajia kufanya kazi na timu ya MCP na washirika wengine katika tasnia ili kuendeleza teknolojia hii.’
Tangu ilipotolewa mnamo Novemba 2024, MCP imepata mvuto mkubwa kama njia rahisi, sanifu ya kuunganisha miundo ya lugha na zana na data.
MCP inawezesha miundo ya AI kupata data kutoka kwa zana za biashara na programu kukamilisha kazi na kupata maktaba za yaliyomo na mazingira ya maendeleo ya programu. Itifaki inaruhusu watengenezaji kuanzisha miunganisho ya pande mbili kati ya vyanzo vya data na programu zinazoendeshwa na AI kama vile chatbots.
Watengenezaji wanaweza kuonyesha interfaces za data kupitia seva za MCP na kujenga wateja wa MCP (kama vile programu na mtiririko wa kazi) kuunganisha kwenye seva hizi. Kwa kuwa Anthropic alifungua chanzo MCP, kampuni kadhaa zimejumuisha msaada wa MCP katika majukwaa yao.
Ironwood: Alfajiri ya Enzi Mpya katika AI
Ironwood TPU ya Google inawakilisha hatua kubwa mbele katika kompyuta ya AI. Utendaji wake usio na kifani, usanifu ulioboreshwa, na msaada kwa itifaki zinazoibuka kama vile A2A na MCP huweka kama kiwezeshaji muhimu cha wimbi linalofuata la uvumbuzi wa AI. Kadiri miundo ya AI inavyokua ngumu zaidi na inayohitaji, Ironwood hutoa nguvu mbichi na unyumbufu unaohitajika ili kufungua uwezekano mpya na kubadilisha tasnia kote ulimwenguni. Sio tu chipu mpya; ni msingi wa siku zijazo zinazoendeshwa na mashine zenye akili zinazofanya kazi kwa ushirikiano ili kutatua matatizo magumu na kuboresha maisha yetu.