Roboti Mpya ya Google: Akili Bandia

Ujio wa Akili Bandia ya Roboti ya Google: Origami, Zipu, na Mustakabali wa Akili Iliyojumuishwa

Google DeepMind imefunua jozi ya mifumo ya akili bandia (AI) ya msingi ambayo iko tayari kuleta mapinduzi katika uwanja wa roboti: Gemini Robotics na Gemini Robotics-ER. Mifumo hii, kulingana na kampuni, inawakilisha hatua kubwa mbele katika kuwezesha roboti za aina na utendaji mbalimbali kuelewa na kuingiliana na ulimwengu wa kimwili kwa viwango vya ustadi na uwezo wa kubadilika ambavyo havijawahi kushuhudiwa. Maendeleo haya yanafungua uwezekano wa kusisimua, ikiwa ni pamoja na matarajio yaliyosubiriwa kwa muda mrefu ya wasaidizi wa roboti za humanoid.

Jitihada za Akili Bandia Iliyojumuishwa: Lengo la Juu Sana

Kwa miaka mingi, sekta ya roboti imefuata lengo gumu la ‘akili bandia iliyojumuishwa’ – kuunda akili bandia yenye uwezo wa kudhibiti roboti kwa uhuru kupitia anuwai ya matukio mapya na yasiyotabirika, huku ikidumisha usalama na usahihi. Tamaa hii, inayofuatiliwa kikamilifu na kampuni kama Nvidia, inabaki kuwa ‘takatifu’ yenye uwezo wa kubadilisha roboti kuwa wafanyikazi hodari wenye uwezo wa kufanya kazi nyingi katika ulimwengu halisi.

Gemini Robotics: Kujenga Juu ya Msingi wa Lugha na Maono

Mifumo mipya ya Google inatumia nguvu ya mfumo mkuu wa lugha wa Gemini 2.0, ikipanua uwezo wake kujumuisha mahitaji maalum ya matumizi ya roboti. Gemini Robotics inajumuisha kile Google inachokiita uwezo wa ‘lugha ya maono-kitendo’ (VLA). Hii inaruhusu mfumo kuchakata pembejeo za kuona, kutafsiri amri za lugha asilia, na kutafsiri pembejeo hizi katika miondoko sahihi ya kimwili. Kinyume chake, Gemini Robotics-ER inazingatia ‘hoja iliyojumuishwa,’ ikijivunia uelewa ulioboreshwa wa anga ambao huwezesha ujumuishaji usio na mshono na mifumo iliyopo ya udhibiti wa roboti.

Kutoka Uelewa hadi Kitendo: Enzi Mpya ya Ustadi

Athari za vitendo za maendeleo haya ni kubwa. Hebu fikiria kumwagiza roboti iliyo na Gemini Robotics ‘chukua ndizi na uiweke kwenye kikapu.’ Roboti, ikitumia maono yake ya msingi wa kamera, ingetambua ndizi na kuelekeza kwa ustadi mkono wake wa roboti kutekeleza kazi hiyo. Au fikiria amri, ‘kunja mbweha wa origami.’ Roboti, ikichota kutoka kwa ujuzi wake wa origami na sanaa maridadi ya kukunja karatasi, ingefanya kazi hiyo ngumu kwa uangalifu.

Mnamo 2023, mfumo wa RT-2 wa Google uliashiria hatua kubwa kuelekea uwezo wa jumla wa roboti. Kwa kutumia data ya Mtandao, RT-2 iliwezesha roboti kuelewa amri za lugha na kuzoea hali mpya, ikiongeza utendaji maradufu kwenye kazi ambazo hazijaonekana ikilinganishwa na mtangulizi wake. Miaka miwili baadaye, Gemini Robotics inaonekana kuwa imefanya hatua nyingine kubwa, ikisonga zaidi ya ufahamu tu kujumuisha utekelezaji wa ujanja tata wa kimwili ambao ulikuwa wazi zaidi ya uwezo wa RT-2.

Wakati RT-2 ilikuwa imefungiwa katika kutumia tena miondoko ya kimwili iliyozoezwa hapo awali, Gemini Robotics inaripotiwa kuonyesha uboreshaji wa ajabu katika ustadi. Ustadi huu mpya unafungua kazi ambazo hazikuweza kufikiwa hapo awali, kama vile sanaa maridadi ya kukunja origami na upakiaji sahihi wa vitafunio kwenye mifuko ya Zip-loc. Mpito huu – kutoka kwa roboti ambazo zinaelewa tu amri hadi roboti zenye uwezo wa kutekeleza kazi maridadi za kimwili – unaashiria kuwa DeepMind inaweza kuwa kwenye kilele cha kutatua mojawapo ya changamoto zinazoendelea zaidi katika roboti: kuwezesha roboti kutafsiri ‘ujuzi’ wao katika miondoko makini, sahihi katika ulimwengu halisi.

Ujumla: Ufunguo wa Kubadilika kwa Ulimwengu Halisi

DeepMind inasisitiza kuwa mfumo mpya wa Gemini Robotics unaonyesha ujumla ulioboreshwa kwa kiasi kikubwa – uwezo wa kufanya kazi mpya ambazo haukufunzwa wazi. Huu ni maendeleo muhimu. Kulingana na tangazo la kampuni, Gemini Robotics ‘inaongeza zaidi ya mara mbili utendaji kwenye kigezo cha kina cha ujumla ikilinganishwa na mifumo mingine ya kisasa ya lugha ya maono-kitendo.’

Ujumla ni muhimu sana kwa sababu roboti zenye uwezo wa kuzoea matukio mapya bila kuhitaji mafunzo maalum kwa kila hali ndio ufunguo wa kufanya kazi kwa ufanisi katika mazingira yasiyotabirika ya ulimwengu halisi. Uwezo huu wa kubadilika ndio unaotenganisha roboti maalum, ya kazi maalum na mashine yenye uwezo mwingi na inayoweza kubadilika.

Ubongo wa Roboti wa Jumla: Maono Kabambe ya Google

Juhudi za Google zinaelekezwa wazi katika kuunda ‘ubongo wa roboti wa jumla’ – AI hodari yenye uwezo wa kudhibiti anuwai ya majukwaa ya roboti. Sambamba na maono haya, kampuni imetangaza ushirikiano na Apptronik, kampuni inayoongoza ya roboti, ili ‘kujenga kizazi kijacho cha roboti za humanoid na Gemini 2.0.’

Ingawa imefunzwa kimsingi kwenye jukwaa la roboti la mikono miwili linalojulikana kama ALOHA 2, Google inasema kuwa Gemini Robotics ina uwezo wa kudhibiti aina mbalimbali za roboti. Hii inajumuisha mikono ya roboti ya Franka inayolenga utafiti na mifumo ya kisasa zaidi ya humanoid kama roboti ya Apollo ya Apptronik. Uwezo huu wa kubadilika unasisitiza uwezo wa Gemini Robotics kuwa ‘ubongo’ wa ulimwengu wote kwa anuwai ya matumizi ya roboti.

Mazingira ya Roboti za Humanoid: Vifaa na Programu Zinaungana

Jitihada za roboti za humanoid ni juhudi shirikishi, huku kampuni nyingi zikichangia katika nyanja tofauti za changamoto. Kampuni kama Figure AI na Boston Dynamics (zamani kampuni tanzu ya Alphabet) zimekuwa zikitengeneza vifaa vya hali ya juu vya roboti za humanoid. Hata hivyo, ‘dereva’ wa AI mwenye ufanisi wa kweli – sehemu ya programu inayoingiza roboti hizi akili na uhuru – imebaki kuwa kipande muhimu kinachokosekana.

Juhudi za Google katika eneo hili zinazidi kuongezeka. Kampuni imetoa ufikiaji mdogo kwa Gemini Robotics-ER kupitia mpango wa ‘jaribio linaloaminika’ kwa kampuni zinazoongoza za roboti, ikiwa ni pamoja na Boston Dynamics, Agility Robotics, na Enchanted Tools. Mbinu hii shirikishi inapendekeza juhudi za pamoja za kuharakisha maendeleo na upelekaji wa roboti za humanoid zenye uwezo wa kweli.

Usalama Kwanza: Mbinu Iliyowekwa Tabaka kwa Roboti Inayowajibika

Ikizingatia umuhimu mkubwa wa usalama katika roboti, Google inasisitiza ‘mbinu iliyowekwa tabaka, ya jumla’ ambayo inajumuisha hatua za jadi za usalama wa roboti. Hatua hizi ni pamoja na kuepuka mgongano na mipaka ya nguvu, kuhakikisha kuwa roboti zinafanya kazi ndani ya vigezo salama.

Zaidi ya hayo, kampuni inaelezea maendeleo ya mfumo wa ‘Katiba ya Roboti’. Mfumo huu, uliochochewa na Sheria Tatu za Roboti za Isaac Asimov, unatoa seti ya kanuni elekezi kwa maendeleo ya kimaadili na salama na upelekaji wa roboti. Kwa kushirikiana na mfumo huu, Google imetoa hifadhidata, iliyopewa jina la ‘ASIMOV,’ iliyoundwa kusaidia watafiti katika kutathmini athari za usalama za vitendo vya roboti.

Hifadhidata ya ASIMOV: Kusawazisha Tathmini ya Usalama

Hifadhidata ya ASIMOV inawakilisha juhudi za Google za kuanzisha mbinu sanifu za kutathmini usalama wa roboti, kupanua zaidi ya kuzuia madhara ya kimwili. Hifadhidata imeundwa kusaidia watafiti kutathmini jinsi mifumo ya AI inavyoelewa matokeo yanayoweza kutokea ya vitendo vya roboti katika matukio mbalimbali. Kulingana na tangazo la Google, hifadhidata ‘itasaidia watafiti kupima kwa ukali athari za usalama za vitendo vya roboti katika matukio ya ulimwengu halisi.’ Mpango huu unasisitiza kujitolea kwa Google kwa uvumbuzi unaowajibika katika uwanja wa roboti.

Mustakabali wa Roboti: Mtazamo wa Uwezekano

Ingawa Google bado haijatangaza ratiba maalum au matumizi ya kibiashara kwa mifumo mipya ya AI, ambayo kwa sasa inabaki katika awamu ya utafiti, maendeleo yaliyoonyeshwa hayana shaka kuwa muhimu. Video za onyesho zilizotolewa na Google zinaonyesha maendeleo ya ajabu katika uwezo unaoendeshwa na AI. Hata hivyo, ni muhimu kukubali kwamba maonyesho haya yamefanywa katika mazingira ya utafiti yaliyodhibitiwa. Jaribio la kweli la mifumo hii litakuwa katika uwezo wao wa kufanya kazi kwa uhakika na kwa usalama katika mazingira yasiyotabirika na yenye nguvu ya ulimwengu halisi.

Maendeleo ya Gemini Robotics na Gemini Robotics-ER yanawakilisha wakati muhimu katika mageuzi ya roboti. Mifumo hii ina uwezo wa kufungua enzi mpya ya ustadi, uwezo wa kubadilika, na uhuru, ikifungua njia kwa roboti kuunganishwa bila mshono katika maisha yetu na kuchangia katika anuwai ya kazi. Utafiti unapoendelea na teknolojia hizi zinakomaa, tunaweza kutarajia mustakabali ambapo roboti zitachukua jukumu kubwa zaidi katika nyumba zetu, maeneo ya kazi, na jamii. Safari kuelekea akili bandia iliyojumuishwa inaendelea, lakini maendeleo ya hivi punde ya Google yanatoa mtazamo wa kuvutia wa uwezekano wa kusisimua ulio mbele. Muunganisho wa vifaa vya kisasa na programu zenye akili zaidi uko tayari kubadilisha mazingira ya roboti, na kutuleta karibu na mustakabali ambapo roboti sio tu zana, bali washirika hodari katika maisha yetu ya kila siku.