Ufunguzi wa Uwezo Usio na Kifani wa Ironwood
Vipimo vya kiufundi vya Ironwood ni vya ajabu kabisa. Ikiwa imekuzwa hadi podi ya chipsi 9,216, inaweza kutoa nguvu ya kompyuta ya AI ya kushangaza ya exaflops 42.5. Takwimu hii inapunguza exaflops 1.7 inayotolewa na El Capitan, kishikiliaji cha sasa cha jina la supercomputer ya haraka zaidi duniani. Kila chipu ya Ironwood ina uwezo wa juu wa kompyuta wa 4,614 TFLOPs.
Zaidi ya nguvu ya usindikaji tu, Ironwood pia ina maboresho makubwa katika kumbukumbu na bandwidth. Kila chipu ina vifaa vya 192GB ya kumbukumbu ya bandwidth ya juu (HBM), ongezeko la mara sita ikilinganishwa na TPU ya kizazi kilichopita, Trillium, ambayo ilitolewa mwaka jana. Zaidi ya hayo, bandwidth ya kumbukumbu kwa kila chipu inafikia 7.2 terabits/s, inayowakilisha uboreshaji wa mara 4.5 juu ya Trillium.
Katika enzi ambapo vituo vya data vinapanuka na matumizi ya nguvu yanakuwa suala muhimu, Ironwood pia inajitokeza kwa ufanisi wake wa nishati. Utendaji wake kwa kila wati ni mara mbili ya Trillium na karibu mara 30 juu kuliko TPU ya kwanza iliyoanzishwa mwaka 2018.
Msisitizo juu ya uboreshaji wa inference unaashiria mabadiliko muhimu katika mandhari ya AI. Katika miaka ya hivi karibuni, maabara zinazoongoza za AI zimejikita hasa katika kujenga mifumo mikubwa zaidi ya msingi na idadi inayoongezeka ya vigezo. Mtazamo wa Google juu ya uboreshaji wa inference unaonyesha mabadiliko kuelekea awamu mpya inayozingatia ufanisi wa upelekaji na uwezo wa inference.
Wakati mafunzo ya mfumo yanasalia kuwa muhimu, idadi ya marudio ya mafunzo ni finyu. Kinyume chake, teknolojia za AI zinapozidi kuunganishwa katika matumizi mbalimbali, shughuli za inference zinatarajiwa kutokea mabilioni ya mara kila siku. Mifumo inavyokua kwa utata, uwezekano wa kiuchumi wa matumizi haya unahusiana kwa karibu na gharama za inference.
Katika miaka minane iliyopita, mahitaji ya Google ya kompyuta ya AI yamekua mara kumi, na kufikia milioni 100 za kushangaza. Bila usanifu maalum kama Ironwood, hata maendeleo yasiyokoma ya Sheria ya Moore yangetatizika kuendana na ukuaji huu wa kielelezo.
Hasa, tangazo la Google linaangazia mtazamo wake juu ya ‘mifumo ya akili’ yenye uwezo wa kufanya kazi ngumu za kufikiri badala ya utambuzi rahisi wa muundo. Hii inaonyesha kwamba Google inaona siku zijazo ambapo AI inaenea zaidi ya mifumo mikubwa na inajumuisha mifumo ambayo inaweza kuvunja matatizo, kufanya mawazo ya hatua nyingi, na kuiga michakato ya mawazo kama ya kibinadamu.
Kuwezesha Kizazi Kijacho cha Mifumo Mikubwa
Google inaweka Ironwood kama miundombinu ya msingi kwa mifumo yake ya juu zaidi ya AI, ikiwa ni pamoja na Gemini 2.5, ambayo inajivunia uwezo wa kufikiri uliojengwa ndani ya asili.
Google pia hivi karibuni imeanzisha Gemini 2.5 Flash, lahaja ndogo ya mfumo wake mkuu iliyoundwa kwa ajili ya maombi nyeti ya latency, ya kila siku. Gemini 2.5 Flash inaweza kurekebisha kwa nguvu kina chake cha kufikiri kulingana na utata wa kidokezo.
Google pia ilionyesha suite yake ya kina ya mifumo ya uzalishaji ya multimodal, ikiwa ni pamoja na maandishi-kwa-picha, maandishi-kwa-video, na kipengele kilichoanzishwa hivi karibuni cha maandishi-kwa-muziki, Lyria. Onyesho lilieleza jinsi zana hizi zinaweza kuunganishwa ili kutoa video kamili ya matangazo kwa tamasha.
Ironwood nisehemu moja tu ya mkakati mpana wa miundombinu ya AI ya Google. Google pia ilitangaza Cloud WAN, huduma ya mtandao mpana iliyosimamiwa ambayo inawezesha makampuni ya biashara kupata miundombinu ya mtandao wa kibinafsi ya kiwango cha kimataifa ya Google.
Zaidi ya hayo, Google inaongeza matoleo yake ya programu kwa ajili ya kazi za AI, ikiwa ni pamoja na Pathways, wakati wa kukimbia wa kujifunza kwa mashine uliotengenezwa na Google DeepMind. Pathways sasa inaruhusu wateja kupanua utoaji wa mfumo katika mamia ya TPU.
Kukuza Ushirikiano wa Wakala wa AI na A2A
Zaidi ya maendeleo ya vifaa, Google pia imeainisha maono yake ya mfumo wa ikolojia wa AI unaozingatia mifumo ya mawakala wengi. Ili kuwezesha uundaji wa mawakala wenye akili, Google imeanzisha itifaki ya Agent-to-Agent (A2A), iliyoundwa kuwezesha mawasiliano salama na sanifu kati ya mawakala tofauti wa AI.
Google inaamini kwamba 2025 itakuwa mwaka wa mabadiliko kwa AI, na matumizi ya AI ya uzalishaji yanaendelea kutoka kujibu maswali moja hadi kutatua matatizo magumu kupitia mifumo ya wakala.
Itifaki ya A2A inawezesha ushirikiano kati ya mawakala katika majukwaa na mifumo tofauti, na kuwapa ‘lugha’ ya kawaida na njia salama za mawasiliano. Itifaki hii inaweza kutazamwa kama safu ya mtandao kwa mawakala wenye akili, inayolenga kurahisisha ushirikiano wa wakala katika mtiririko wa kazi ngumu. Kwa kuwezesha mawakala maalum wa AI kufanya kazi pamoja kwenye kazi za utata na muda tofauti, A2A inatafuta kuongeza uwezo wa jumla kupitia ushirikiano.
A2A inafanya kazi kwa kuanzisha njia sanifu ya mawakala kubadilishana habari na kuratibu hatua, bila kuhitaji wao kushiriki kanuni za msingi au miundo ya data. Hii inaruhusu uundaji wa mifumo ya AI ya msimu na rahisi zaidi, ambapo mawakala wanaweza kuongezwa kwa urahisi, kuondolewa, au kusanidiwa tena inavyohitajika.
Google imetoa ulinganisho kati ya itifaki za MCP na A2A katika chapisho la blogu.
- MCP (Model Context Protocol) imeundwa kwa ajili ya usimamizi wa zana na rasilimali.
- Inaunganisha mawakala na zana, API, na rasilimali kupitia ingizo/pato lililoandaliwa.
- Google ADK inasaidia zana za MCP, kuwezesha seva mbalimbali za MCP kufanya kazi na mawakala.
- A2A (Agent2Agent Protocol) imeundwa kwa ajili ya ushirikiano kati ya mawakala.
- Inawezesha mawasiliano yenye nguvu, ya aina nyingi kati ya mawakala bila kushiriki kumbukumbu, rasilimali, au zana.
- Ni kiwango wazi kinachoendeshwa na jumuiya.
- Mifano inaweza kutazamwa kwa kutumia Google ADK, LangGraph, Crew.AI, na zana nyingine.
Kimsingi, A2A na MCP zinakamilishana: MCP inawapa mawakala msaada wa zana, wakati A2A inawezesha mawakala hawa walio na vifaa vya zana kuwasiliana na kushirikiana na kila mmoja.
Kwa kuzingatia washirika wa awali, A2A inaonekana kuwa tayari kupata tahadhari sawa na MCP. Zaidi ya makampuni 50 yamejiunga na ushirikiano wa awali, ikiwa ni pamoja na makampuni ya teknolojia yanayoongoza na watoa huduma wa juu wa ushauri wa kimataifa na ushirikiano wa mifumo.
Google inasisitiza uwazi wa itifaki, ikiweka kama njia sanifu kwa mawakala kushirikiana, bila kujali mfumo wa teknolojia ya msingi au mtoa huduma. Google ilieleza kanuni tano muhimu ambazo ziliongoza muundo wa itifaki kwa kushirikiana na washirika wake:
- Kubali Uwezo wa Wakala: A2A inalenga kuwezesha mawakala kushirikiana katika njia yao ya asili, isiyo na muundo, hata kama hawashiriki kumbukumbu, zana, na muktadha. Itifaki inalenga kuwezesha matukio ya kweli ya mawakala wengi, badala ya kuwazuia mawakala kuwa ‘zana’ tu.
- Jenga Juu ya Viwango Vilivyopo: Itifaki inajenga juu ya viwango maarufu vilivyopo, ikiwa ni pamoja na HTTP, SSE, na JSON-RPC, na kuifanya iwe rahisi kuunganisha na rafu zilizopo za IT zinazotumiwa na makampuni ya biashara.
- Salama kwa Chaguomsingi: A2A imeundwa kusaidia uthibitishaji na uidhinishaji wa kiwango cha biashara, sawa na miradi ya uthibitishaji ya OpenAPI wakati wa uzinduzi.
- Usaidizi Kazi za Muda Mrefu: A2A imeundwa kuwa rahisi, inasaidia anuwai ya matukio, kutoka kwa kazi za haraka hadi utafiti wa kina ambao unaweza kuchukua masaa au hata siku (wakati wanadamu wanahusika). Katika mchakato wote, A2A inaweza kuwapa watumiaji maoni ya wakati halisi, arifa, na sasisho za hali.
- Ujuzi wa Modality: Ulimwengu wa mawakala hauzuiliwi kwa maandishi, ndiyo sababu A2A imeundwa kusaidia modalities mbalimbali, ikiwa ni pamoja na mito ya sauti na video.
Google inatoa mfano wa jinsi A2A inaweza kurahisisha sana mchakato wa kukodisha.
Katika kiolesura kilichounganishwa kama Agentspace, meneja wa kukodisha anaweza kumpa wakala kutafuta wagombea wanaofaa kulingana na mahitaji ya kazi. Wakala huyu anaweza kuingiliana na mawakala maalum kutafuta wagombea, kuratibu mahojiano, na hata kuwashirikisha mawakala wengine maalum kusaidia na ukaguzi wa usuli, kuwezesha otomatiki yenye akili ya mchakato mzima wa kukodisha katika mifumo tofauti.
Kukumbatia Itifaki ya Muktadha wa Mfumo (MCP)
Mbali na juhudi zake katika kuendeleza A2A, Google pia inakumbatia Itifaki ya Muktadha wa Mfumo (MCP). Wiki chache tu baada ya OpenAI kutangaza kupitishwa kwake kwa MCP, Google ilifuata mkondo huo.
Demis Hassabis, Mkurugenzi Mtendaji wa Google DeepMind, hivi karibuni alitangaza kwenye X kwamba Google itaongeza msaada kwa MCP kwa mifumo yake ya Gemini na SDK. Hata hivyo, hakutoa muda maalum.
Hassabis alisema kwamba ‘MCP ni itifaki bora ambayo inakuwa haraka kiwango wazi kwa enzi ya wakala wa AI. Ninatazamia kufanya kazi na timu ya MCP na washirika wengine katika tasnia ili kuendeleza teknolojia hii.’
Tangu kutolewa kwake mnamo Novemba 2024, MCP imepata mvuto haraka, na kuwa njia rahisi na sanifu ya kuunganisha mifumo ya lugha na zana na data.
MCP inawezesha mifumo ya AI kufikia data kutoka kwa vyanzo kama vile zana za biashara na programu ili kukamilisha kazi, pamoja na kufikia maktaba za maudhui na mazingira ya uundaji wa programu. Itifaki inaruhusu watengenezaji kuanzisha miunganisho ya pande mbili kati ya vyanzo vya data na programu zinazotumia AI, kama vile chatbots.
Wasanidi programu wanaweza kufichua violesura vya data kupitia seva za MCP na kujenga wateja wa MCP (kama vile programu na mtiririko wa kazi) ili kuunganisha kwenye seva hizi. Kwa kuwa Anthropic ilifungua chanzo cha MCP, makampuni mengi yameunganisha usaidizi wa MCP kwenye majukwaa yao.