Sasisho za AI na Usaidizi Mpya

Ili kusherehekea Siku ya Uhamasishaji Ulimwenguni Kuhusu Ufikivu (GAAD), tunafurahi kuzindua sasisho mpya za Android na Chrome, pamoja na rasilimali mpya za mfumo ikolojia. Maendeleo katika akili bandia yanaendelea kufanya ulimwengu wetu uweze kupatikana zaidi. Leo, kusherehekea Siku ya Uhamasishaji Ulimwenguni Kuhusu Ufikivu, tunatoa sasisho mpya kwa bidhaa za Android na Chrome, na kuongeza rasilimali mpya kwa watengenezaji wa kujenga zana za utambuzi wa hotuba.

Ubunifu Zaidi Unaotokana na AI wa Android

Tunaimarisha kazi yetu na kuunganisha vipengele bora vya Google AI na Gemini katika uzoefu wa msingi wa simu iliyoboreshwa kwa ajili ya kuona na kusikia.

Pata Maelezo Yote Kupitia Gemini na TalkBack

Mwaka jana, tulianzisha uwezo wa Gemini kwa msomaji wa skrini wa Android TalkBack, kuwapa watu wasioona au wenye matatizo ya kuona maelezo yaliyozalishwa na akili bandia ya picha, hata kama hakuna maandishi mengine. Leo, tunaongeza ujumuishaji huu wa Gemini ili watu waweze kuuliza maswali na kupata majibu kuhusu picha zao.

Hii inamaanisha kwamba wakati mwingine rafiki yako atakutumia picha ya gitaa lao jipya, unaweza kupata maelezo na kuuliza maswali zaidi kuhusu chapa na rangi, au hata ni nini kingine kilichopo kwenye picha. Sasa, watu wanaweza pia kupata maelezo na kuuliza maswali kuhusu skrini yao yote. Kwa hivyo, ikiwa unanunua mauzo ya hivi karibuni kwenye programu yako unayoipenda ya ununuzi, unaweza kuuliza Gemini kuhusu nyenzo za bidhaa au ikiwa kuna punguzo lolote.

Kwa usahihi zaidi, sasisho hili huinua maelezo ya picha kwa viwango visivyojawahi kutokea kwa kutumia nguvu ya Gemini. Watumiaji hawazuiwi tena kwa maelezo tuli; wanaweza kuingiliana na picha, kuuliza maswali maalum, na kupata majibu ya kina. Kwa mfano, mtumiaji anaweza kupakia picha ya alama ya kihistoria na kuuliza kuhusu mtindo wake wa usanifu, mwaka wa ujenzi, au maelezo mengine yoyote muhimu. Uwezo wa akili wa Gemini utachanganua picha, kutoa habari inayofaa, na kutoa majibu kamili katika muundo rahisi kueleweka.

Zaidi ya hayo, ujumuishaji wa Gemini na TalkBack huenda zaidi ya utambuzi rahisi wa picha. Pia inaenea kwa maudhui ya skrini, ikiruhusu watumiaji kuuliza maswali kuhusu taarifa iliyoonyeshwa kwenye vifaa vyao. Ikiwa una matatizo ya kuvinjari ukurasa changamano wa wavuti au kutumia programu usiyoifahamu, unaweza kuamilisha TalkBack na kuuliza Gemini kwa ufafanuzi au mwongozo. Gemini itachanganua maudhui ya skrini, itambue vipengele muhimu, na kutoa maelezo au maagizo kwa njia wazi na fupi. Mbinu hii shirikishi huwezesha watumiaji wenye matatizo ya kuona kuvinjari ulimwengu wa kidijitali kwa kujiamini na uhuru usiofananishwa.

Elewa Hisia Zaidi Nyuma ya Manukuu

Kwa manukuu ya wazi, simu yako inaweza kutoa manukuu ya moja kwa moja kwa kitu chochote chenye sauti kwenye programu nyingi kwenye simu yako – kwa kutumia akili bandia kunasa sio tu kile mtu anasema, lakini pia jinsi wanasema. Tunajua njia moja watu wanavyojieleza ni kwa kunyoosha sauti ya maneno yao, ndiyo maana tumetengeneza kipengele kipya cha muda kwenye manukuu ya wazi, ili uweze kujua wakati mtangazaji wa michezo anapiga kelele “pigo la kushangaza”, au ujumbe wa video sio “hapana” lakini “laaaaaaa.” Utapokea pia lebo zaidi za sauti, ili uweze kujua wakati mtu anapiga kelele au anakohoa. Toleo hili jipya linaanza kutolewa kwa Kiingereza nchini Merika, Uingereza, Kanada, na Australia kwenye vifaa vinavyotumia Android 15 na matoleo mapya zaidi.

Manukuu ya Wazi hubadilisha kabisa uzoefu wa manukuu kwa kunasa mabadiliko madogo ya sauti, kasi ya usemi, na dalili za sauti. Fikiria hili: Kiwango rahisi cha “sawa” kinaweza kufikisha kibali, msisimko, au kejeli. Manukuu ya jadi yanaweza tu kunasa maneno, lakini Manukuu ya Wazi hufumbua hisia zilizofichwa na huwasilisha kwa watazamaji kupitia vidokezo vya maandishi. Kwa mfano, mlio unaweza kuashiria kufadhaika au uchovu, wakati kicheko kinaweza kuonyesha burudani au furaha. Kwa kujumuisha dalili hizi zisizo za maneno, Manukuu ya Wazi huongeza kina na muktadha kwa uzoefu wa kutazama kwa watu wasiosikia au wale wanaopendelea kutegemea misaada ya kuona.

Zaidi ya hayo, kipengele cha muda wa Manukuu ya Wazi huongeza safu nyingine ya uhalisi na ushiriki. Kwa kuonyesha kwa usahihi kunyooshwa na kuongezwa kwa maneno, manukuu huwasilisha ukali wa kihisia na umuhimu wa mzungumzaji. “Hapana!” yenye urefu huwasilisha upinzani zaidi kuliko “Hapana” fupi, wakati “Mkuu” mrefu huvutia msisimko na hofu. Uangalifu huu kwa undani hufanya manukuu yazidi kuvutia, kuelimisha, na kujenga mahusiano, na hivyo kuchochea muunganiko mkuu kati ya watazamaji na maudhui wanayotumia.

Mbali na uboreshaji wa kihisia, Manukuu ya Wazi pia yanashirikisha lebo za sauti ili kutambua na kuandika dalili mbalimbali za sauti, kama vile filimbi, kicheko, na makofi. Lebo hizi huongeza muktadha kwa manukuu na kuruhusu watazamaji kuelewa kikamilifu mazingira ya sauti, hata kama uwezo wao wa kusikia umepunguzwa. Kwa kutambua vipengele muhimu vya sauti, Manukuu ya Wazi huwawezesha watazamaji kushiriki na kuelewa maudhui wanayotumia, thusly daraja pengo kati ya habari za sauti na za kuona.

Kuboresha Utambuzi wa Hotuba Ulimwenguni

Mnamo 2019, tulianzisha Mradi wa Euphonia ili kutafuta njia za kufanya utambuzi wa hotuba uweze kupatikana zaidi kwa watu wasio na hotuba ya kawaida. Kwa sasa, tunaunga mkono watengenezaji na mashirika ulimwenguni tunapopeleka kazi hii kwa lugha nyingi na miktadha ya kitamaduni.

Rasilimali Mpya za Watengenezaji

Ili kuboresha mfumo ikolojia wa zana ulimwenguni, tunawapa watengenezaji hifadhi yetu ya chanzo wazi kupitia ukurasa wa GitHub wa Mradi wa Euphonia. Sasa wanaweza kutengeneza zana za sauti zilizobinafsishwa kwa ajili ya utafiti au kutoa mafunzo kwa miundo yao ili kuchukua hotuba tofauti.

Kwa kutoa hifadhi ya chanzo wazi, Google inaruhusu watengenezaji, watafiti, na mashirika kutumia matokeo ya Mradi wa Euphonia na kuchangia humo. Mbinu hii shirikishi huharakisha maendeleo ya teknolojia ya utambuzi wa hotuba kwa hotuba isiyo ya kawaida, na kuhakikisha kwamba kupatikana kwake kunaenea kwa lugha mbalimbali na miktadha ya kitamaduni. Kwa kushiriki msimbo, seti za data, na miundo, Google hukuza jumuiya ya uvumbuzi na majaribio, na thusly huunda suluhu za kimapinduzi za teknolojia za usaidizi.

Zaidi ya hayo, upatikanaji wa rasilimali za watengenezaji huwezesha watu binafsi au mashirika kubinafsisha zana za utambuzi wa hotuba ili kukidhi mahitaji yao maalum. Watafiti wanaweza kutumia rasilimali hizi kuchunguza mifumo tofauti ya hotuba na kuendeleza algorithms ambazo zinaweza kuandika kwa usahihi aina mbalimbali za njia za kuzungumza. Makampuni mapya au biashara ndogo zinaweza kuzingatia katika programu au huduma zao ili kukuza ujumuishaji na upatikanaji wao. Kwa kupunguza kizingiti cha kuingia kwa teknolojia ya utambuzi wa hotuba, Google huwezesha uvumbuzi na huwawezesha watengenezaji kuunda suluhu muhimu ambazo huwawezesha watu wenye matatizo ya hotuba kuwasiliana na kuingiliana na ulimwengu.

Kusaidia Miradi Mipya Barani Afrika

Mapema mwaka huu, tulishirikiana na Google.org kutoa usaidizi kwa UCL kuunda Kituo cha Ujumuishaji wa Lugha ya Dijitali (CDLI). CDLI imejitolea kuboresha utambuzi wa hotuba kwa watu wasioongea Kiingereza barani Afrika kwa kuunda seti wazi za data kwa lugha 10 za Kiafrika, kujenga miundo mipya ya utambuzi wa hotuba, na kuendelea kusaidia mashirika na watengenezaji ecosystem katika uwanja huu.

Usaidizi wa Google.org kwa Kituo cha Ujumuishaji wa Lugha ya Dijitali (CDLI) ni ushahidi wa dhamira ya kampuni ya kuziba pengo la teknolojia ya lugha barani Afrika. Kwa kutoa fedha na rasilimali kwa CDLI, Google inasaidia maendeleo ya miundo sahihi zaidi na jumuishi ya utambuzi wa hotuba barani Afrika. Kuzingatia kwa CDLI katika kuunda seti kubwa za data wazi kwa lugha za Kiafrika ni hatua muhimu mbele katika kutoa mafunzo kwa mifumo madhubuti ya utambuzi wa hotuba. Kwa kukusanya na kueleza sampuli za hotuba katika lugha za Kiafrika, Kituo cha Ujumuishaji wa Lugha ya Dijitali (CDLI) kinatengeneza mazingira ya baadaye ya teknolojia ya utambuzi wa hotuba ambayo inaweza kunakili kwa usahihi hotuba ya watu barani Afrika, bila kujali lugha au lafudhi yao.

Mbali na kuunda seti za data, Kituo cha Ujumuishaji wa Lugha ya Dijitali (CDLI) pia kimejitolea kujenga miundo mipya ya utambuzi wa hotuba ambayo imeundwa mahususi kuandaa sifa za kipekee za lugha za lugha za Kiafrika. Miundo hii inazingatia mabadiliko ya toni, mifumo ya hotuba, na msamiati wa lugha za Kiafrika, ambazo mara nyingi hutofautiana na Kiingereza na lugha zingine zilizosomwa sana. Kwa kubinafsisha miundo ya utambuzi wa hotuba ili kuchukua ugumu wa lugha za Kiafrika, CDLI inaboresha usahihi na uaminifu wa teknolojia ya utambuzi wa hotuba, na hivyo kurahisisha watu barani Afrika kuipata na kuitumia.

Muhimu zaidi, Kituo cha Ujumuishaji wa Lugha ya Dijitali (CDLI) kinaweka nguvu katika kusaidia mashirika na mfumo wa ikolojia wa watengenezaji barani Afrika. CDLI hutoa programu za mafunzo, fursa za ushauri, na rasilimali za kifedha ili kusaidia kujenga ustadi, ushirikishwaji wa wataalamu. Kwa kusaidia maendeleo ya teknolojia za lugha za Kiafrika, CDLI inaunda fursa za kiuchumi kwa watu barani Afrika na kujenga mustakabali dhabiti, shirikishi wa kidijitali.

Kupanua Machaguo ya Usaidizi kwa Wanafunzi

Zana za usaidizi hasa ni muhimu kwa wanafunzi wenye ulemavu, kuanzia kutumia ishara za uso ili kupitia Chromebooks zao kwa kutumia Kidhibiti cha Uso hadi kubadilisha matumizi yao ya usomaji kwa kutumia Hali ya Kusoma.

Sasa, unapotumia programu ya jaribio la Bodi ya Chuo Bluebook kwenye Chromebook (ambapo wanafunzi wanaweza kuchukua SAT na mitihani mingi ya kozi ya Advanced Placement), utaweza kutumia vipengele vyote vilivyojengwa ndani vya Google vya usaidizi. Hii inajumuisha msomaji wa skrini wa ChromeVox na uandikaji, pamoja na zana za majaribio ya kidijitali za Bodi ya Chuo.

Hivi ndivyo vipengele vya usaidizi vinavyobadilisha sana uzoefu wa kujifunza kwa wanafunzi wenye ulemavu tofauti:

  • Wanafunzi wenye matatizo ya kuona wanaweza kutumia msomaji wa skrini wa ChromeVox, ambaye anaweza kusoma kwa sauti maandishi kwenye skrini, na hivyo kuruhusu kupata maudhui yaliyoandikwa, hata kama hawawezi kuyaona. ChromeVox pia inaweza kutoa maelezo kuhusu picha, vitufe na viungo, na hivyo kuwawezesha wanafunzi kuvinjari wavuti na programu kwa urahisi.
  • Wanafunzi wenye matatizo ya harakati wanaweza kupata kazi ya Kidhibiti cha Uso ya Kidhibiti cha Uso kuwa muhimu sana, kwani inawaruhusu kupitia Chromebook kwa kutumia ishara za uso (kama vile tabasamu au kuinua nyusi zao). Njia hii ya urubani isiyo na mikono inaweza kubadilisha mchezo kwa wanafunzi ambao hawawezi kutumia kibodi au panya kwa njia ya kimila.
  • Wanafunzi wenye ulemavu wa kujifunza wanaweza kutumia Modi ya Kusoma ili kubadilisha uzoefu wao wa kusoma. Modi ya Kusoma inawaruhusu wanafunzi kurekebisha ukubwa wa fonti, rangi na nafasi, na thusly kurahisisha usomaji wa maandishi. Pia inaweza kuondoa vizuizi, kama vile michoro na matangazo, na kuwawezesha wanafunzi kuzingatia maudhui.

Kwa ujumla, zana za usaidizi za Google zinafungua ulimwengu wa uwezekano kwa wanafunzi wenye ulemavu. Kwa kutoa ufikiaji na usaidizi uliobinafsishwa, zana hizi huwawezesha wanafunzi kushinda vikwazo, kufikia uwezo wao kamili na kufaulu kitaaluma.

Kufanya Chrome Iweze Kupatikana Zaidi

Zaidi ya watu bilioni 2 hutumia Chrome kila siku, na tunajitolea mara kwa mara kufanya kivinjari chetu kiwe rahisi kutumia na kufanya vipengele kama vile manukuu ya moja kwa moja na vibandiko vya picha kwa watumiaji wa visoma skrini vipatikane kwa kila mtu.

Ufikiaji Rahisi wa PDF kwenye Chrome

Hapo awali, ufunguapo PDF iliyochanganuliwa kwenye kivinjari chako cha Chrome cha eneo-kazi, usingeweza kuingiliana nayo kwa visoma skrini. Sasa ukiwa na utambazaji wa herufi za macho (OCR), Chrome itatambua aina hizi za PDF kiotomatiki, na thusly unaweza kuangazia, kunakili na kutafuta maandishi, na kuvisoma kwa visoma skrini, kama ukurasa mwingine wowote.

Ujumuishaji wa teknolojia ya utambazaji wa herufi za macho (OCR) hubadilisha jinsi watu wasioona au wale wanaopendelea kutumia visoma skrini kupata maudhui wanavyotumia faili za PDF. Hapo awali, faili za PDF zilizochanganuliwa zilikuwa hazipatikani kwa visoma skrini, kwani zilitendewa kama michoro badala ya maandishi yanayoweza kusomeka. Hii inamaanisha kwamba watu wenye matatizo ya kuona hawangeweza kusoma, kutafuta au kuingiliana na maudhui yaliyo katika faili za PDF zilizochanganuliwa.

Kwa kutumia teknolojia ya OCR, Chrome sasa inaweza kuchanganua PDF zilizochanganuliwa kiotomatiki, kutambua maandishi kwenye faili na kuyabadilisha kuwa muundo unaoweza kusomeka. Mchakato huu huruhusu visoma skrini kusoma maandishi yaliyo kwenye PDF, na thusly kurahisisha watu wenye matatizo ya kuona kufikia na kutumia faili hizi kama waraka mwingine wowote wa kidijitali.

Faida za ujumuishaji wa OCR zina pande nyingi:

  • Ufikiaji ulioimarishwa: OCR hufanya faili za PDF zilizochanganuliwa ambazo hapo awali hazipatikani na watu wanaotumia visoma skrini zipatikane. Hii hufungua ulimwengu wa uwezekano kwa watu ambao hawangeweza kufikia hati zilizochanganuliwa kwa kujitegemea.
  • Uzoefu bora wa mtumiaji: OCR inawawezesha watumiaji kuingiliana na faili za PDF zilizochanganuliwa kwa njia sawa na waraka mwingine wowote wa kidijitali. Wanaweza kuangazia maandishi, kunakili sehemu, na kutafuta maneno au vishazi maalum, na thusly hukuza matumizi yao ya kusoma na utafiti.
  • Ufanisi ulioongezeka: OCR huondoa hitaji la kuandika mwenyewe maandishi yaliyo katika faili za PDF zilizochanganuliwa. Hii huokoa muda na nguvu, na kuwawezesha watumiaji kuzingatia kazi inayowakabili badala ya kujaribu kupata habari.

Kwa ujumla, ujumuishaji wa teknolojia ya OCR katika Chrome ni hatua muhimu mbele ambayo hurahisisha watu wasioona ufikiaji wa faili za PDF. Kwa kufanya hati ambazo hapo awali hazipatikani ziweze kutafutwa, kusomeka na mwingiliano, Chrome inasaidia kuziba mgawanyiko wa kidijitali kati ya watu wanaokabiliwa na changamoto za usomi na kujifunza.

Soma kwa Urahisi na Ukuzaji wa Ukurasa

Ukuzaji wa ukurasa sasa hukuruhusu kuongeza ukubwa wa maandishi unayoona katika Chrome ya Android bila kuathiri mpangilio wa ukurasa wa wavuti au uzoefu wako wa kuvinjari – kama inavyofanya kwenye Chrome ya kompyuta. Unaweza kubinafsisha ukubwa unaotaka kukuza na utumie mapendeleo kwa urahisi kwa kurasa zote unazozitembelea au kurasa maalum pekee.

Kazi ya ukuzaji wa ukurasa inaweza kubadilisha maisha kwa watu wenye matatizo ya maono au wale wanaopendelea uwazi wa maandishi makubwa, ili usomaji uwe rahisi zaidi. Kwa kuruhusu watumiaji kurekebisha saizi ya maandishi bila kuathiri mpangilio wa ukurasa wa wavuti, Chrome inahakikisha kwamba maandishi yanaburudisha zaidi kuona na rahisi kusoma, bila hatari ya maandishi kushambana au kuharibu umbizo.

Kazi ya ukuzaji wa ukurasa ina faida zifuatazo:

  • Usomaji Ulioimarishwa: Ukuzaji wa ukurasa huwezesha watumiaji kurekebisha saizi ya maandishi wanayoona, na thusly kurahisisha na kufurahisha usomaji. Huu ni muhimu hasa kwa watu wenye matatizo ya maono, usomaji hafifu au matatizo mengine ya maono.
  • Faraja Inayoongezeka: Ukuzaji wa ukurasa huwezesha watumiaji kubinafsisha saizi ya maandishi ili kukidhi mapendeleo yao binafsi na mahitaji ya maono. Hii husaidia kupunguza mkazo wa macho na husababisha usomaji wa maudhui marefu kuwa rahisi zaidi.
  • Uhifadhi wa Mpangilio: Tofauti na kukuza ukurasa mzima wa wavuti kwa urahisi, ukuzaji wa ukurasa huruhusu watumiajikukaza au kupunguza saizi ya maandishi, huku wakidumisha uadilifu wa mpangilio wa asili. Hii inahakikisha kwamba ukurasa wa wavuti ni rahisi kupitia, na kwamba vipengele vyote vimewekwa kama ilivyokusudiwa.
  • Ubinafsishaji Flexible: Ukuzaji wa ukurasa hutoa anuwai ya fursa za ubinafsishaji, na kuwaruhusu watumiaji kuchanganya saizi ya maandishi ili kukidhi mahitaji yao maalum. Watumiaji wanaweza kuchagua saizi zilizofafanuliwa awali au kuweka nambari maalum, na kutumia mapendeleo yao kwa kurasa zote za wavuti au tovuti maalum pekee.

Ili kuanza kutumia kitendakazi hiki, bonyeza tu kwenye menyu ya dots tatu iliyo kwenye kona ya juu kulia ya Chrome, kisha uweke mapendeleo yako ya ukuzaji.