नवीन AI आणि प्रवेशयोग्यता अद्यतने | mr

जागतिक प्रवेशयोग्यता जागरूकता दिनानिमित्त (GAAD), Android आणि Chrome च्या नवीन अपडेट्स सादर करताना आणि इकोसिस्टमसाठी नवीन संसाधने देताना आम्हाला आनंद होत आहे. कृत्रिम बुद्धिमत्तेमधील (Artificial intelligence) प्रगतीमुळे आपले जग अधिकाधिक प्रवेशयोग्य होत आहे. आज, जागतिक प्रवेशयोग्यता जागरूकता दिन साजरा करत असताना, आम्ही Android आणि Chrome उत्पादनांसाठी नवीन अपडेट्स लाँच करत आहोत आणि डेव्हलपर्सना (developers)speech recognition tools तयार करण्यासाठी नवीन संसाधने देत आहोत.

कृत्रिम बुद्धिमत्तेवर आधारित Android नवकल्पना

आम्ही Google AI आणि Gemini ची सर्वोत्तम वैशिष्ट्ये एकत्रित करून श्रवण आणि दृष्टी impaired लोकांसाठी mobile experience सुधारित करत आहोत.

Gemini आणि TalkBack द्वारे अधिक माहिती मिळवा

गेल्या वर्षी, आम्ही Android च्या स्क्रीन रीडर TalkBack मध्ये Gemini ची वैशिष्ट्ये समाविष्ट केली, ज्यामुळे अंध किंवा दृष्टी impaired लोकांना AI-व्युत्पन्न इमेज डिस्क्रिप्शन (image description) मिळतील, जरी alternative text उपलब्ध नसेल तरी. आज, आम्ही हे Gemini इंटिग्रेशन (integration) वाढवत आहोत, जेणेकरून लोकांना त्यांच्या इमेज (image)बद्दल प्रश्न विचारता येतील आणि उत्तरे मिळवता येतील.

याचा अर्थ असा आहे की, पुढच्या वेळी एखाद्या मित्राने तुम्हाला त्यांच्या नवीन गिटारचा फोटो पाठवला, तर तुम्हाला त्याचे वर्णन मिळेल आणि तुम्ही ब्रँड (brand) आणि रंगाबद्दल पुढील प्रश्न विचारू शकता. इतकेच नव्हे, तर इमेजमध्ये (image) आणखी काय आहे, हेही विचारू शकता. आता, लोकांना त्यांच्या संपूर्ण स्क्रीनबद्दल (screen) वर्णन मिळू शकेल आणि प्रश्न विचारता येतील. त्यामुळे, जर तुम्ही तुमच्या आवडत्या शॉपिंग ॲपवर (shopping app)नवीनतम जाहिरात पाहत असाल, तर तुम्ही Gemini ला वस्तूच्या मटेरियल (material)बद्दल किंवा सवलतीबद्दल विचारू शकता.

अधिक स्पष्टपणे सांगायचे झाल्यास, हे अपडेट (update) Gemini च्या शक्तिशाली क्षमतेचा उपयोग करून इमेज (image) वर्णनांना अभूतपूर्व स्तरावर घेऊन जाते. वापरकर्ते आता केवळ स्थिर वर्णनांपुरते मर्यादित राहणार नाहीत; ते इमेजशी (image) संवाद साधू शकतात, विशिष्ट प्रश्न विचारू शकतात आणि तपशीलवार उत्तरे मिळवू शकतात. उदाहरणार्थ, वापरकर्ता ऐतिहासिक स्थळाचा फोटो अपलोड (upload) करू शकतो आणि त्याच्या आर्किटेक्चरल (architectural) शैलीबद्दल, बांधकामाच्या वर्षाबद्दल किंवा इतर कोणत्याही संबंधित तपशीलांबद्दल विचारू शकतो. Gemini ची intelligent processing क्षमता इमेजचे (image) विश्लेषण करेल, संबंधित माहिती काढेल आणि समजण्यास सोप्या स्वरूपात सर्वसमावेशक प्रतिसाद देईल.

याव्यतिरिक्त, Gemini चे TalkBack मध्ये इंटिग्रेशन (integration) केवळ image recognition पलीकडे जाते. हे स्क्रीन कंटेंटपर्यंत (screen content) देखील विस्तारित आहे, जे वापरकर्त्यांना त्यांच्या डिव्हाइसवर (device) दिसणाऱ्या माहितीबद्दल प्रश्न विचारण्याची परवानगी देते. जर तुम्हाला एखादे जटिल वेबपृष्ठ ब्राउझ (browse) करताना किंवा एखाद्या अनोळखी ॲपचा (app) वापर करताना अडचण येत असेल, तर तुम्ही TalkBack सक्रिय करू शकता आणि Gemini ला स्पष्टीकरण किंवा मार्गदर्शन मागू शकता. Gemini स्क्रीन कंटेंटचे (screen content) विश्लेषण करेल, महत्त्वाचे घटक ओळखेल आणि स्पष्ट आणि संक्षिप्त पद्धतीने स्पष्टीकरण किंवा सूचना देईल. हा इंटरॲक्टिव्ह (interactive) दृष्टिकोन दृष्टी impaired व्यक्तींना पूर्वीपेक्षा अधिक आत्मविश्वास आणि स्वतंत्रपणे डिजिटल (digital) जग एक्सप्लोर (explore) करण्यास सक्षम करतो.

Subtitle मागील भावना अधिक चांगल्या प्रकारे समजून घ्या

Expressive Captions च्या मदतीने, तुमचा फोन (phone) तुमच्या फोनवरील (phone) बहुतेक ॲप्समधील (apps) कोणत्याही ध्वनीसाठी रिअल-टाइम (real-time) subtitle देऊ शकतो - AI चा वापर करून, कोणी काय बोलत आहे हेच नाही, तर ते कसे बोलत आहेत हे देखील समजते. आम्हाला माहीत आहे की, लोक स्वतःला व्यक्त करण्याचा एक मार्ग म्हणजे ते शब्दांना किती ताणून बोलतात, म्हणूनच आम्ही Expressive Captions वर नवीन duration feature विकसित केले आहे, त्यामुळे क्रीडा समालोचक (sports commentator) “amaaazing शॉट” कधी ओरडतो किंवा व्हिडिओ (video) संदेशात “नाही” ऐवजी “नाहीiiii” आहे, हे तुम्हाला कळेल. तुम्हाला ध्वनी लेबल्सदेखील (sound labels) मिळतील, त्यामुळे एखादी व्यक्ती कधी शिट्टी मारत आहे किंवा आपला घसा साफ करत आहे, हे तुम्हाला कळेल. हे नवीन व्हर्जन (version) अमेरिका, यूके, कॅनडा (Canada) आणि ऑस्ट्रेलियामध्ये (Australia) इंग्रजी भाषेत (English language) Android 15 आणि त्यावरील व्हर्जनवर (version)उपलब्ध आहे.

Expressive Captions सूक्ष्म स्वरातील बदल, बोलण्याची गती आणि ध्वनी क्लू (sound clues) कॅप्चर (capture) करून subtitle अनुभवात बदल घडवते. विचार करा: साध्या “ठीक आहे” ने परवानगी, उत्साह किंवा उपहास व्यक्त करता येतो. पारंपरिक subtitle फक्त शब्द रेकॉर्ड (record) करू शकतात, तर Expressive Captions लपलेल्या भावना उलगडतात आणि त्या text prompt द्वारे दर्शकांना सांगतात. उदाहरणार्थ, सुस्कारा निराशा किंवा थकवा दर्शवू शकतो, तर खुदुखुदु हसणे मनोरंजन किंवा आनंद दर्शवू शकते. या गैर-मौखिक क्लूंचा समावेश करून, Expressive Captions श्रवण impaired असलेल्या किंवा व्हिज्युअल एड्सवर (visual aids) अवलंबून राहणाऱ्या लोकांच्या पाहण्याच्या अनुभवात अधिक माहिती आणि संदर्भ जोडतात.

शिवाय, Expressive Captions चे duration feature सत्यता आणि engagement चा आणखी एक स्तर जोडते. शब्दांचे ताणणे आणि लांबवणे अचूकपणे दर्शवून subtitle बोलणाऱ्याच्या भावनात्मक तीव्रतेची आणि महत्त्वाकांक्षाची जाणीव करून देतात. एक लांबलेला “नाही!” संक्षिप्त “नाही” पेक्षा अधिक प्रतिकार दर्शवतो, तर ताणलेला “उत्कृष्ट” उत्साह आणि आदर दर्शवतो. तपशीलाकडे दिलेले हे लक्ष subtitle अधिक आकर्षक, माहितीपूर्ण आणि संबंधित बनवते, ज्यामुळे दर्शक आणि ते उपभोगत असलेल्या कंटेंटमध्ये (content) सखोल संबंध निर्माण होतो.

भावनात्मक वाढीव्यतिरिक्त, Expressive Captions मध्ये शिट्ट्या, हशा आणि टाळ्यांसारख्या विविध ध्वनी क्लू (sound clues) ओळखण्यासाठी आणि त्यांचे transcription करण्यासाठी sound labels देखील समाविष्ट आहेत. ही लेबल्स subtitle ला संदर्भ जोडतात आणि दर्शकांना ऑडिओ (audio) वातावरणाची पूर्ण जाणीव करून देतात, जरी त्यांची श्रवण क्षमता कमी असली तरी. मुख्य ध्वनी घटकांची ओळख पटवून, Expressive Captions दर्शकांना ते उपभोगत असलेल्या कंटेंटमध्ये (content) सहभागी होण्यास आणि ते समजून घेण्यास सक्षम करतात. अशा प्रकारे श्रवण आणि व्हिज्युअल (visual) माहितीमधील अंतर कमी होते.

जगभरातील speech recognition मध्ये सुधारणा

2019 मध्ये, आम्ही Euphonia प्रोजेक्ट सुरू केला, ज्याचा उद्देश Non-standard speech असलेल्या लोकांसाठी speech recognition अधिक सुलभ करणे हा होता. आता, आम्ही जगभरातील डेव्हलपर्स (developers)आणि संस्थांना पाठिंबा देत आहोत, कारण ते हे काम अधिक भाषा आणि सांस्कृतिक संदर्भांमध्ये घेऊन जात आहेत.

नवीन डेव्हलपर संसाधने

जागतिक स्तरावर टूल्सचे (tools)इकोसिस्टम (ecosystem) सुधारण्यासाठी, आम्ही Euphonia प्रोजेक्टच्या GitHub पेजद्वारे डेव्हलपर्ससाठी (developers)आमचे ओपन-सोर्स (open-source) repository (repository)उपलब्ध करून देत आहोत. ते आता संशोधनासाठी पर्सनलाइज्ड (personalized) ऑडिओ टूल्स (audio tools) विकसित करू शकतात किंवा वेगवेगळ्या speech पॅटर्नशी (speech patterns) जुळण्यासाठी त्यांच्या मॉडेल्सना (models) प्रशिक्षित करू शकतात.

ओपन-सोर्स (open-source) repository (repository)उपलब्ध करून देऊन, Google डेव्हलपर्स (developers), संशोधक आणि संस्थांना Euphonia प्रोजेक्टच्या निष्कर्षांचा उपयोग करण्यास आणि त्यात योगदान देण्यास अनुमती देते. हा सहकार्यात्मक दृष्टिकोन Non-standard speech साठी speech recognition तंत्रज्ञानातील प्रगतीला गती देतो, तसेच त्याची उपलब्धता विविध भाषा आणि सांस्कृतिक संदर्भांमध्ये सुनिश्चित करतो. कोड, डेटासेट (dataset)आणि मॉडेल्स (models) सामायिक करून, Google नवोपक्रम आणि प्रयोगांचे एक समुदाय तयार करते, जे auxiliary तंत्रज्ञानासाठी breakthrough सोल्यूशन्स (solutions)तयार करतात.

याव्यतिरिक्त, डेव्हलपर संसाधनांची उपलब्धता व्यक्ती किंवा संस्थांना speech recognition टूल्स (speech recognition tools) त्यांच्या विशिष्ट गरजा पूर्ण करण्यासाठी सानुकूलित करण्यास सक्षम करते. संशोधक विविध speech पॅटर्नचा (speech patterns) अभ्यास करण्यासाठी आणि विविध बोलण्याच्या पद्धतींचे अचूक transcription करू शकणाऱ्या algorithms विकसित करण्यासाठी या संसाधनांचा उपयोग करू शकतात. स्टार्टअप (startup) किंवा लहान व्यवसाय त्यांची application किंवा service मध्ये समाविष्ट करू शकतात. speech recognition तंत्रज्ञानाचा वापर कमी करून, Google नवनवीन कल्पनांना प्रोत्साहन देते आणि डेव्हलपर्सना (developers)असे अर्थपूर्ण सोल्यूशन्स (solutions) तयार करण्यास सक्षम करते, ज्यामुळे speech impaired लोकांना जगाशी संवाद साधता येतो.

आफ्रिकेतील नवीन प्रकल्पांना समर्थन

या वर्षाच्या सुरुवातीला, आम्ही Google.org सोबत भागीदारी केली आणि University College London येथे डिजिटल (digital) भाषा समावेशन केंद्र (CDLI) तयार करण्यासाठी पाठिंबा दिला. CDLI आफ्रिकन (African) लोकांमध्ये speech recognition तंत्रज्ञान सुधारण्यासाठी वचनबद्ध आहे. यासाठी 10 आफ्रिकन (African) भाषांचे ओपन-सोर्स (open-source) डेटासेट (dataset) तयार करणे, नवीन speech recognition मॉडेल्स (models) तयार करणे आणि या क्षेत्रातील संस्था आणि डेव्हलपर इकोसिस्टमला (developer ecosystem) पाठिंबा देणे यांचा समावेश आहे.

डिजिटल (digital) भाषा समावेशन केंद्राला (CDLI) Google.org चा पाठिंबा आफ्रिकन (African) भाषेतील तंत्रज्ञानातील अंतर कमी करण्याच्या कंपनीच्या वचनबद्धतेचा पुरावा आहे. CDLI ला निधी आणि संसाधने देऊन, Google आफ्रिका खंडातील अधिक अचूक आणि सर्वसमावेशक speech recognition मॉडेल (speech recognition model) विकसित करण्यात मदत करत आहे. CDLI आफ्रिकन (African) भाषांसाठी मोठ्या प्रमाणात ओपन डेटासेट (open dataset) तयार करण्यावर लक्ष केंद्रित करत आहे, जे मजबूत speech recognition सिस्टमला (speech recognition system) प्रशिक्षित करण्यासाठी एक महत्त्वाचे पाऊल आहे. आफ्रिकन (African) भाषांमधील speech सॅम्पल्स (speech samples) गोळा करून आणि त्यांची नोंदणी करून, डिजिटल (digital) भाषा समावेशन केंद्र (CDLI) speech recognition तंत्रज्ञानाच्या भविष्यासाठी पाया तयार करत आहे.

डेटासेट (dataset) तयार करण्याव्यतिरिक्त, डिजिटल (digital) भाषा समावेशन केंद्र (CDLI) नवीन speech recognition मॉडेल (speech recognition model) तयार करण्यासाठी समर्पित आहे, जे आफ्रिकन (African) भाषांच्या unique भाषिक वैशिष्ट्यांसाठी डिझाइन (design) केलेले आहेत. ही मॉडेल्स (models) आफ्रिकन (African) भाषांमधील tonal बदल, speech पॅटर्न (speech pattern)आणि शब्दसंग्रह विचारात घेतात, जे सहसा इंग्रजी आणि इतर मोठ्या प्रमाणावर अभ्यासलेल्या भाषांपेक्षा वेगळे असतात. आफ्रिकन (African) भाषांच्या complexities जुळण्यासाठी speech recognition मॉडेल (speech recognition model) सानुकूलित करून, CDLI speech recognition तंत्रज्ञानाची अचूकता आणि विश्वासार्हता सुधारत आहे, त्यामुळे आफ्रिकन (African) लोक ते ॲक्सेस (access) करू शकतात आणि वापरू शकतात.

डिजिटल (digital) भाषा समावेशन केंद्र (CDLI) आफ्रिका खंडातील संस्था आणि डेव्हलपर इकोसिस्टमला (developer ecosystem) पाठिंबा देण्यावर लक्ष केंद्रित करत आहे. CDLI प्रशिक्षण कार्यक्रम, मार्गदर्शन संधी आणि आर्थिक संसाधने प्रदान करते, ज्यामुळे तज्ञांचे कुशल समुदाय तयार होतो. आफ्रिकन (African) भाषेतील तंत्रज्ञानाच्या प्रगतीला प्रोत्साहन देऊन, CDLI आफ्रिकन (African) लोकांसाठी आर्थिक संधी निर्माण करत आहे आणि एक मजबूत, सर्वसमावेशक डिजिटल (digital) भविष्य निर्माण करत आहे.

विद्यार्थ्यांसाठी प्रवेशयोग्य पर्याय वाढवणे

विकलांग विद्यार्थ्यांसाठी प्रवेशयोग्यता विशेषतः उपयुक्त आहे, जसे की चेहऱ्यावरील हावभावांचा वापर करून त्यांच्या Chromebook मध्ये नेव्हिगेट (navigate) करणे किंवा रीडिंग मोड (reading mode) वापरून त्यांचा वाचनाचा अनुभव सानुकूलित करणे.

आता, जेव्हा तुम्ही College Board ची Bluebook टेस्ट application तुमच्या Chromebook वर वापरता (ज्यात विद्यार्थी SAT आणि बहुतेक Advanced Placement परीक्षा देऊ शकतात), तेव्हा तुम्ही Google च्या सर्व इन-बिल्ट (in-built) प्रवेशयोग्यता वैशिष्ट्यांचा वापर करू शकता. यात ChromeVox स्क्रीन रीडर (screen reader) आणि श्रुतलेखन, तसेच College Board च्या स्वतःच्या डिजिटल (digital) टेस्ट टूल्सचा (test tools) समावेश आहे.

प्रवेशयोग्यता विविध विकलांग विद्यार्थ्यांच्या शिक्षणाच्या अनुभवात कसे बदल घडवते ते खालीलप्रमाणे:

दृष्टी impaired विद्यार्थी ChromeVox स्क्रीन रीडरचा (screen reader) उपयोग करू शकतात, जो स्क्रीनवरील मजकूर वाचून दाखवतो. ChromeVox प्रतिमा, बटणे आणि लिंक्सबद्दल वर्णन देखील देऊ शकतो, ज्यामुळे विद्यार्थ्यांना वेब आणि application सहजपणे navigate करता येतात.
ज्या विद्यार्थ्यांना हालचाल करण्याची impairment आहे, त्यांना चेहऱ्यावरील नियंत्रणाचे face control वैशिष्ट्य उपयुक्त ठरू शकते, जे त्यांना चेहऱ्यावरील हावभावांचा (जसे की हसणे किंवा भुवया उंचावणे) वापर करून Chromebook navigate करण्याची परवानगी देते. ज्या विद्यार्थ्यांना पारंपरिक पद्धतीने कीबोर्ड (keyboard) किंवा माउस (mouse) वापरता येत नाही, त्यांच्यासाठी हे खूप उपयुक्त ठरू शकते.
ज्या विद्यार्थ्यांना लर्निंग impairment आहे, ते रीडिंग मोडचा (reading mode) वापर करून त्यांच्या वाचनाचा अनुभव सानुकूलित करू शकतात. रीडिंग मोड (reading mode) विद्यार्थ्यांना फॉन्ट (font) आकार, रंग आणि अंतर समायोजित करण्यास अनुमती देतो, ज्यामुळे त्यांना मजकूर वाचणे सोपे होते. हे प्रतिमा आणि जाहिरातींसारख्या distractions देखील काढून टाकते, ज्यामुळे विद्यार्थ्यांना कंटेंटवर (content) लक्ष केंद्रित करता येते.

एकंदरीत, Google ची प्रवेशयोग्यता वैशिष्ट्ये विकलांग विद्यार्थ्यांसाठी शक्यतांचे एक जग उघडतात. सानुकूलित ॲक्सेस (access) आणि सपोर्ट (support) प्रदान करून, ही वैशिष्ट्ये विद्यार्थ्यांना अडचणींवर मात करण्यास, त्यांची क्षमता पूर्णपणे विकसित करण्यास आणि शैक्षणिक क्षेत्रात यशस्वी होण्यास सक्षम करतात.

Chrome अधिक ॲक्सेसिबल (accessible) बनवा

दररोज 2 अब्जाहून अधिक लोक Chrome वापरतात आणि आम्ही नेहमीच आमचे ब्राउझर (browser) वापरण्यास सोपे बनवण्यासाठी वचनबद्ध आहोत. रिअल-टाइम (real-time) subtitle आणि स्क्रीन रीडर (screen reader) वापरकर्त्यांसाठी इमेज (image) वर्णनांसारखी वैशिष्ट्ये सर्वांसाठी उपलब्ध करून देण्यासाठी आम्ही प्रयत्नशील आहोत.

Chrome वर PDF ॲक्सेस (access) करणे अधिक सोपे

पूर्वी, जर तुम्ही तुमच्या डेस्कटॉप (desktop) Chrome ब्राउझरमध्ये (browser) स्कॅन (scan) केलेले PDF उघडले, तर तुम्ही स्क्रीन रीडरने (screen reader) त्याच्याशी संवाद साधू शकत नव्हता. आता ऑप्टिकल (optical) कॅरॅक्टर (character) recognition (OCR) मुळे, Chrome आपोआप या प्रकारचे PDF ओळखेल, त्यामुळे तुम्ही इतर कोणत्याही पेजप्रमाणे टेक्स्ट highlight, कॉपी (copy) आणि शोधू शकता आणि स्क्रीन रीडरने (screen reader) ते वाचू शकता.

ऑप्टिकल (optical) कॅरॅक्टर (character) recognition (OCR) तंत्रज्ञानाच्या एकत्रीकरणामुळे दृष्टी impaired असलेल्या किंवा स्क्रीन रीडर (screen reader) वापरून कंटेंट (content) ॲक्सेस (access) करण्यास प्राधान्य देणाऱ्या व्यक्ती PDF फाईल्स (PDF files) वापरण्याच्या पद्धतीत बदल झाला आहे. पूर्वी, स्कॅन (scan) केलेल्या PDF फाईल्स (PDF files) स्क्रीन रीडरसाठी (screen reader) ॲक्सेसिबल (accessible) नव्हत्या, कारण त्यांना मशीन-readable टेक्स्टऐवजी प्रतिमा मानले जात होते. याचा अर्थ असा होता की, दृष्टी impaired असलेले लोक स्कॅन (scan) केलेल्या PDF फाईल्समधील (PDF files) कंटेंट (content) वाचू शकत नव्हते, शोधू शकत नव्हते किंवा त्याच्याशी संवाद साधू शकत नव्हते.

OCR तंत्रज्ञानामुळे, Chrome आता आपोआप स्कॅन (scan) केलेल्या PDF चे विश्लेषण करू शकतो, फाईलमधील (file) मजकूर ओळखू शकतो आणि त्याचे मशीन-readable फॉरमॅटमध्ये (machine-readable format) रूपांतर करू शकतो. ही प्रक्रिया स्क्रीन रीडरला (screen reader) PDF मधील मजकूर वाचण्यास सक्षम करते, ज्यामुळे दृष्टी impaired असलेले लोक इतर कोणत्याही डिजिटल (digital) डॉक्युमेंटप्रमाणे (document) या फाईल्स (files) ॲक्सेस (access) करू शकतात आणि वापरू शकतात.

OCR एकत्रीकरणाचे अनेक फायदे आहेत:

वाढलेली ॲक्सेसिबिलिटी (accessibility): OCR पूर्वी ॲक्सेसिबल (accessible) नसलेल्या स्कॅन (scan) केलेल्या PDF फाईल्स (PDF files) स्क्रीन रीडर (screen reader) वापरणाऱ्या लोकांसाठी ॲक्सेसिबल (accessible) बनवते. हे स्कॅन (scan) केलेले डॉक्युमेंट (document) स्वतंत्रपणे ॲक्सेस (access) करू शकत नसलेल्या लोकांसाठी शक्यतांचे एक जग उघडते.
सुधारित वापरकर्ता अनुभव: OCR वापरकर्त्यांना स्कॅन (scan) केलेल्या PDF फाईल्सशी (PDF files) इतर कोणत्याही डिजिटल (digital) डॉक्युमेंटप्रमाणे (document) संवाद साधण्याची परवानगी देते. ते टेक्स्ट highlight करू शकतात, विशिष्ट भाग कॉपी (copy) करू शकतात आणि विशिष्ट शब्द किंवा वाक्ये शोधू शकतात, ज्यामुळे त्यांचा वाचन आणि संशोधन अनुभव वाढतो.
उच्च कार्यक्षमता: OCR स्कॅन (scan) केलेल्या PDF फाईल्समधील (PDF files) टेक्स्ट manual transcription करण्याची गरज दूर करते. यामुळे वेळ आणि श्रम वाचतात, ज्यामुळे वापरकर्ते माहिती ॲक्सेस (access) करण्याऐवजी त्यांच्या कामावर लक्ष केंद्रित करू शकतात.

एकंदरीत, Chrome मध्ये OCR तंत्रज्ञानाचे एकत्रीकरण एक महत्त्वपूर्ण प्रगती आहे, ज्यामुळे दृष्टी impaired असलेल्या लोकांसाठी PDF फाईल्स (PDF files) ॲक्सेस (access) करणे अधिक सोपे झाले आहे. पूर्वी ॲक्सेस (access) न करता येण्याजोग्या डॉक्युमेंट्सना (documents) शोधण्यायोग्य, वाचनीय आणि इंटरॲक्टिव्ह (interactive) बनवून, Chrome वाचन आणि अध्ययनात अडचणी येत असलेल्या व्यक्तींमधील डिजिटल (digital) दरी कमी करण्यास मदत करत आहे.

पेज झूमने (page zoom) सहज वाचा

पेज झूम (page zoom) आता तुम्हाला Android च्या Chrome मध्ये वेबपेजच्या (webpage) लेआउटवर परिणाम न करता तुम्ही पाहता त्या टेक्स्टचा (text) आकार वाढवण्याची परवानगी देते — जसे ते Chrome डेस्कटॉपवर (desktop) कार्य करते. तुम्ही किती झूम (zoom) करायचे आहे, ते सानुकूलित करू शकता आणि तुम्ही भेट देत असलेल्या सर्व पेजेसवर किंवा फक्त विशिष्ट पेजेसवर प्राधान्ये सहजपणे लागू करू शकता.

पेज झूम (page zoom) वैशिष्ट्य दृष्टी impaired असलेल्या किंवा वाचण्यास सोपे करण्यासाठी मोठ्या टेक्स्टमध्ये (text) स्पष्टता शोधणाऱ्या लोकांसाठी उपयुक्त ठरू शकते. वेबपेजच्या (webpage) लेआउटवर परिणाम न करता टेक्स्टचा (text) आकार समायोजित करण्याची परवानगी देऊन, Chrome हे सुनिश्चित करते की, टेक्स्ट (text) पाहण्यास अधिक आरामदायक आणि वाचण्यास सोपे आहे, टेक्स्ट (text) overlap होण्याची किंवा फॉरमॅटिंग (formatting) बिघडण्याची शक्यता नाही.

पेज झूम (page zoom) वैशिष्ट्याचे फायदे:

सुधारित वाचनीयता: पेज झूम (page zoom) वापरकर्त्यांना त्यांना दिसणाऱ्या टेक्स्टचा (text) आकार समायोजित करण्यास अनुमती देते, ज्यामुळे ते वाचणे सोपे आणि अधिक आनंददायी होते. हे दृष्टी impaired, डिस्लेक्सिया (dyslexia) किंवा इतर दृष्टी impairments असलेल्या लोकांसाठी विशेषतः उपयुक्त आहे.
वाढलेली सोयी: पेज झूम (page zoom) वापरकर्त्यांना त्यांची वैयक्तिक प्राधान्ये आणि दृष्टी आवश्यकता पूर्ण करण्यासाठी टेक्स्टचा (text) आकार सानुकूलित करण्यास अनुमती देते. हे डोळ्यांवर येणारा ताण कमी करण्यास मदत करते आणि जास्त वेळ कंटेंट (content) वाचणे अधिक आरामदायक करते.
लेआउट जतन करणे: संपूर्ण वेबपेज (webpage) झूम (zoom) करण्याऐवजी, पेज झूम (page zoom) वापरकर्त्यांना मूळ लेआउटची (layout) अखंडता टिकवून ठेवून फक्त टेक्स्टचा (text) आकार वाढवण्याची किंवा कमी करण्याची परवानगी देते. हे सुनिश्चित करते की, वेबपेज (webpage) navigate करण्यास सोपे आहे आणि सर्व घटक अपेक्षेप्रमाणे ठेवलेले आहेत.
लवचिक सानुकूलन: पेज झूम (page zoom) सानुकूलन पर्यायांची विस्तृत श्रेणी प्रदान करते, ज्यामुळे वापरकर्त्यांना त्यांच्या विशिष्ट गरजा पूर्ण करण्यासाठी टेक्स्टचा (text) आकार ॲडजस्ट (adjust) करता येतो. वापरकर्ते पूर्वनिर्धारित झूम (zoom) लेव्हल्स (levels) निवडू शकतात किंवा सानुकूल व्हॅल्यूज (values) प्रविष्ट करू शकतात आणि त्यांची प्राधान्ये सर्व वेबपेजेसवर (webpage) किंवा फक्त विशिष्ट वेबसाईटवर (website) लागू करू शकतात.

हे वैशिष्ट्य वापरणे सुरू करण्यासाठी, Chrome च्या उजव्या कोपऱ्यातील तीन डॉट्सच्या (dots) मेनूवर क्लिक (click) करा आणि नंतर तुमचे झूम (zoom) प्राधान्ये सेट (set) करा.

रोजी अद्यतनित २०२५-०५-१७

# Google # Gemini # AIGC