Pembaruan AI & Aksesibilitas di Android & Chrome

Untuk merayakan Hari Kesadaran Aksesibilitas Global (GAAD), kami dengan senang hati mengumumkan pembaruan baru untuk Android dan Chrome, serta sumber daya baru untuk ekosistem. Kemajuan dalam kecerdasan buatan terus membuat dunia kita semakin mudah diakses. Hari ini, untuk merayakan Hari Kesadaran Aksesibilitas Global, kami meluncurkan pembaruan baru untuk produk Android dan Chrome kami, serta sumber daya baru untuk pengembang yang membangun alat pengenalan ucapan.

Lebih Banyak Inovasi Android yang Didukung oleh AI

Kami mengkonsolidasikan pekerjaan kami dan mengintegrasikan Google AI dan fitur terbaik Gemini ke dalam pengalaman seluler inti yang disesuaikan untuk penglihatan dan pendengaran.

Dapatkan Semua Detail dengan Gemini dan TalkBack

Tahun lalu, kami menghadirkan kemampuan Gemini ke TalkBack, pembaca layar Android, untuk memberikan deskripsi gambar yang dihasilkan AI kepada orang-orang tunanetra atau dengan gangguan penglihatan, bahkan jika tidak ada teks alternatif. Hari ini, kami memperluas integrasi Gemini ini sehingga orang dapat mengajukan pertanyaan dan mendapatkan jawaban tentang gambar mereka.

Ini berarti bahwa lain kali seorang teman mengirimkan foto gitar baru mereka kepada Anda, Anda bisa mendapatkan deskripsi dan menanyakan pertanyaan lanjutan tentang merek dan warnanya, atau bahkan tentang apa lagi yang ada di gambar tersebut. Sekarang, orang juga bisa mendapatkan deskripsi dan menanyakan pertanyaan tentang seluruh layar mereka. Jadi, jika Anda berbelanja promo terbaru di aplikasi belanja favorit Anda, Anda dapat bertanya kepada Gemini tentang bahan item tersebut atau apakah ada diskon.

Lebih khusus lagi, pembaruan ini meningkatkan deskripsi gambar ke tingkat yang belum pernah terjadi sebelumnya dengan memanfaatkan kekuatan Gemini. Pengguna tidak lagi terbatas pada deskripsi statis; mereka dapat berinteraksi dengan gambar, mengajukan pertanyaan khusus, dan menerima jawaban bernuansa. Misalnya, pengguna dapat mengunggah foto tengara bersejarah dan menanyakan tentang gaya arsitekturnya, tahun pembangunannya, atau detail relevan lainnya. Kemampuan pemrosesan cerdas Gemini akan mengurai gambar, mengekstrak informasi yang relevan, dan memberikan respons komprehensif dalam format yang mudah dipahami.

Selain itu, integrasi Gemini dengan TalkBack melampaui pengenalan gambar sederhana. Ini juga meluas ke konten layar, memungkinkan pengguna untuk mengajukan pertanyaan tentang informasi yang ditampilkan di perangkat mereka. Jika Anda mengalami kesulitan menjelajahi halaman web yang kompleks atau menggunakan aplikasi yang tidak dikenal, Anda cukup mengaktifkan TalkBack dan meminta Gemini untuk klarifikasi atau panduan. Gemini akan menganalisis konten layar, mengidentifikasi elemen kunci, dan memberikan penjelasan atau instruksi dengan cara yang jelas dan ringkas. Pendekatan interaktif ini memberdayakan pengguna dengan gangguan penglihatan untuk menavigasi dunia digital dengan kepercayaan diri dan kemandirian yang belum pernah terjadi sebelumnya.

Memahami Lebih Banyak Emosi di Balik Teks

Dengan Teks Ekspresif, ponsel Anda dapat menyediakan teks waktu nyata untuk apa pun yang memiliki suara dari sebagian besar aplikasi di ponsel Anda — menggunakan AI untuk tidak hanya menangkap apa yang dikatakan seseorang, tetapi juga cara mereka mengatakannya. Kita tahu bahwa salah satu cara orang mengekspresikan diri adalah dengan melantunkan suara kata-kata mereka, itulah sebabnya kami mengembangkan fitur durasi baru di Teks Ekspresif, sehingga Anda dapat mengetahui kapan penyiar olahraga berteriak “tembakan yang mengagumkan”, atau pesan video bukan “tidak” tetapi “tidaaaak”. Anda juga akan menerima lebih banyak label suara, sehingga Anda dapat mengetahui kapan seseorang bersiul atau berdeham. Rilis baru ini diluncurkan dalam bahasa Inggris di Amerika Serikat, Inggris, Kanada, dan Australia, untuk perangkat yang menjalankan Android 15 dan yang lebih baru.

Teks Ekspresif merevolusi pengalaman teks dengan menangkap variasi infleksi halus, kecepatan bicara, dan isyarat vokal. Coba pikirkan ini: kata sederhana “oke” dapat menyampaikan persetujuan, kegembiraan, atau sarkasme, tergantung pada penyampaiannya. Sementara teks tradisional hanya dapat mencatat kata-kata, Teks Ekspresif memecahkan kode emosi tersembunyi dan mengomunikasikannya melalui petunjuk tekstual. Misalnya, desahan dapat mengindikasikan frustrasi atau kelelahan, sementara terkekeh dapat menunjukkan hiburan atau kebahagiaan. Dengan menyertakan isyarat nonverbal ini, Teks Ekspresif menambahkan kedalaman dan konteks pada pengalaman menonton bagi individu dengan gangguan pendengaran atau mereka yang lebih suka mengandalkan bantuan visual.

Selain itu, fitur durasi Teks Ekspresif menambahkan lapisan realisme dan keterlibatan lainnya. Dengan secara akurat mencerminkan peregangan dan pemanjangan kata-kata, teks menyampaikan intensitas emosional dan signifikansi pembicara. “Tidak!” yang berkepanjangan menyampaikan lebih banyak perlawanan daripada “tidak” yang singkat, sementara “luar biasa” yang ditarik membangkitkan kegembiraan dan kekaguman. Perhatian terhadap detail ini membuat teks lebih menarik, informatif, dan beresonansi, menumbuhkan hubungan yang lebih dalam antara pemirsa dan konten yang mereka konsumsi.

Selain peningkatan emosional, Teks Ekspresif menyertakan label suara untuk mengidentifikasi dan mentranskripsi berbagai isyarat audio, seperti siulan, tawa, dan tepuk tangan. Label-label ini menambahkan konteks ke teks dan memungkinkan pemirsa untuk sepenuhnya memahami lingkungan audio, bahkan jika pendengaran mereka terganggu. Dengan mengenali elemen suara penting, Teks Ekspresif memberdayakan pemirsa untuk terlibat dengan dan memahami konten yang mereka konsumsi, menjembatani kesenjangan antara informasi pendengaran dan visual.

Meningkatkan Pengenalan Ucapan di Seluruh Dunia

Pada tahun 2019, kami meluncurkan Proyek Euphonia untuk menemukan cara agar pengenalan ucapan lebih mudah diakses oleh orang-orang dengan ucapan non-standar. Sekarang, kami mendukung pengembang dan organisasi di seluruh dunia saat mereka membawa pekerjaan ini ke lebih banyak bahasa dan konteks budaya.

Sumber Daya Pengembang Baru

Untuk meningkatkan ekosistem alat di seluruh dunia, kami membuat repositori sumber terbuka kami tersedia untuk pengembang melalui halaman GitHub Proyek Euphonia. Mereka sekarang dapat mengembangkan alat audio yang dipersonalisasi untuk penelitian, atau melatih model mereka agar beradaptasi dengan pola ucapan yang berbeda.

Dengan menyediakan repositori sumber terbuka, Google memungkinkan pengembang, peneliti, dan organisasi untuk memanfaatkan dan berkontribusi pada hasil Proyek Euphonia. Pendekatan kolaboratif ini mempercepat kemajuan teknologi pengenalan ucapan untuk ucapan non-standar, memastikan bahwa ketersediaannya meluas ke berbagai bahasa dan konteks budaya. Dengan berbagi kode, kumpulan data, dan model, Google menumbuhkan komunitas inovasi dan eksperimen, menciptakan solusi inovatif untuk teknologi bantu.

Selain itu, ketersediaan sumber daya pengembang memberdayakan individu atau organisasi untuk menyesuaikan alat pengenalan ucapan untuk memenuhi kebutuhan spesifik mereka. Peneliti dapat memanfaatkan sumber daya ini untuk menyelidiki pola ucapan yang berbeda dan mengembangkan algoritma yang secara akurat dapat mentranskripsi berbagai cara berbicara. Startup atau bisnis kecil dapat mengintegrasikannya ke dalam aplikasi atau layanan mereka untuk meningkatkan inklusivitas dan aksesibilitas mereka. Dengan menurunkan hambatan masuk untuk teknologi pengenalan ucapan, Google mengaktifkan inovasi dan memberdayakan pengembang untuk menciptakan solusi yang bermakna yang memungkinkan orang-orang dengan gangguan bicara untuk berkomunikasi dan berinteraksi dengan dunia.

Mendukung Proyek Baru di Afrika

Awal tahun ini, kami bermitra dengan Google.org untuk memberikan dukungan kepada Pusat Inklusi Bahasa Digital (CDLI) di University College London. CDLI berdedikasi untuk meningkatkan pengenalan ucapan untuk orang-orang yang tidak berbahasa Inggris di Afrika dengan membuat kumpulan data sumber terbuka dari 10 bahasa Afrika, membangun model pengenalan ucapan baru, dan terus mendukung organisasi dan ekosistem pengembang di lapangan.

Dukungan Google.org untuk Pusat Inklusi Bahasa Digital (CDLI) adalah bukti komitmen perusahaan untuk menjembatani kesenjangan teknologi bahasa di Afrika. Dengan memberikan dana dan sumber daya kepada CDLI, Google membantu mengembangkan model pengenalan ucapan yang lebih akurat dan inklusif di benua Afrika. Fokus CDLI pada pembuatan kumpulan data terbuka skala besar dari bahasa-bahasa Afrika adalah langkah penting dalam melatih sistem pengenalan ucapan yang kuat. Dengan mengumpulkan dan membuat anotasi sampel ucapan dari bahasa-bahasa Afrika, CDLI meletakkan dasar untuk masa depan teknologi pengenalan ucapan yang secara akurat dapat mentranskripsi ucapan orang-orang Afrika, terlepas dari bahasa atau aksen mereka.

Selain membuat kumpulan data, CDLI juga bekerja untuk membangun model pengenalan ucapan baru yang secara khusus dirancang untuk karakteristik linguistik unik dari bahasa-bahasa Afrika. Model-model ini mempertimbangkan variasi nada, pola bicara, dan kosakata bahasa-bahasa Afrika yang sering kali berbeda dari bahasa Inggris dan bahasa-bahasa lain yang banyak dipelajari. Dengan menyesuaikan model pengenalan ucapan untuk mengakomodasi kompleksitas bahasa-bahasa Afrika, CDLI meningkatkan akurasi dan keandalan teknologi pengenalan ucapan, membuatnya lebih mudah diakses dan bermanfaat bagi orang-orang Afrika.

Yang terpenting adalah CDLI berfokus pada dukungan organisasi dan ekosistem pengembang di benua Afrika. CDLI menyediakan program pelatihan, peluang bimbingan, dan sumber daya keuangan untuk membantu membangun komunitas ahli yang terampil. Dengan memajukan kemajuan teknologi bahasa Afrika, CDLI क्रिएटिंग peluang ekonomi untuk orang-orang Afrika dan membangun masa depan डिजिटल yang kuat dan inklusif।

Memperluas Opsi Aksesibilitas untuk Siswa

Alat bantu aksesibilitas sangat berguna bagi siswa penyandang disabilitas, mulai dari使用 gesture wajah untuk menavigasi Chromebook mereka dengan Kontrol Wajah hingga penggunaan Mode Pembaca untuk menyesuaikan pengalaman membaca mereka.

Sekarang, saat Anda menggunakan aplikasi pengujian Bluebook College Board di Chromebook Anda — tempat siswa dapat mengikuti SAT dan sebagian besar ujian Penempatan Lanjutan — Anda akan memiliki akses ke semua fitur aksesibilitas bawaan Google. Ini termasuk pembaca layar ChromeVox dan pendiktean, serta alat pengujian डिजिटल College Board sendiri.

Berikut adalah cara alat bantu aksesibilitas dapat merevolusi pengalaman belajar bagi siswa dari berbagai kemampuan:

  • Siswa dengan gangguan penglihatan dapat memanfaatkan pembaca layar ChromeVox, yang membacakan teks di layar dengan lantang, membuat konten tertulis dapat diakses bahkan jika mereka tidak dapat melihatnya. ChromeVox juga dapat memberikan deskripsi gambar, tombol, dan tautan, memungkinkan siswa menavigasi वेब dan aplikasi dengan lancar.
  • Siswa penyandang disabilitas मोटर mungkin menemukan fitur Kontrol Wajah Kontrol Wajah sangat berguna, yang memungkinkan mereka menggunakan ekspresi wajah, seperti tersenyum atau mengangkat alis, untuk menavigasi Chromebook. Metode kontrol handsfree ini dapat menjadi pengubah permainan bagi siswa yang tidak dapat menggunakan कीबोर्ड atau માઉસ secara tradisional।
  • Siswa dengan kesulitan belajar dapat menggunakan Mode Baca untuk menyesuaikan pengalaman membaca mereka. Mode Baca memungkinkan siswa menyesuaikan ukuran, warna, dan spasi font, membuatnya lebih mudah bagi他们เพื่ออ่านข้อความ. Ini juga dapat menghilangkan gangguan, seperti gambar dan iklan, memungkinkan siswa untuk tetap fokus pada konten.

Secara keseluruhan, alat bantu aksesibilitas Google membuka dunia peluang bagi siswa penyandang disabilitas। dengan memberikan akses dan dukungan yang dapat disesuaikan, alat-alat ini memberdayakan siswa untuk mengatasi rintangan, mencapai potensi penuh mereka, dan berhasil secara академик।

Membuat Chrome Lebih Mudah Diakses

Dengan lebih dari 2 miliar orang yang menggunakan Chrome setiap hari, kami selalu berupaya membuat browser kami lebih mudah digunakan dan membuat fitur seperti takarir langsung dan deskripsi gambar untuk pengguna pembaca layar tersedia untuk सभी orang।

Akses PDF yang Lebih Mudah di Chrome

Sebelumnya, jika Anda membuka PDF yang dipindai di browser Chrome डेस्कटॉपของคุณ, Anda tidak dapat berinteraksi dengan itu menggunakan pembaca layar। Sekarang, dengan pengenalan karakter optik (OCR), Chrome secara otomatis mengenali jenis PDF ini sehingga Anda dapat menyorot, menyalin, dan mencari teks seperti halaman lainnya, dan membacanya dengan pembaca layar।

Integrasi teknologi pengenalan karakter optik (OCR) telah merevolusi cara individu dengan gangguan प्राइमोमोमोโมโมโมโมमोโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมमोโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมमोโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมमोโมโมโมโมโมโมโมโมમોโมโมमोโมโมโมโมโมโมโมโมโมโมโมโมमोमोโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมमोโมโมโมโมโมमोโมโมโมโมโมโมโมโมโมโมโมમોโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมमोโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมमोโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมमोโมμοโมโมโมโมโมโมโมโมโมโมโมโมமோโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมμοโมमोโมโมโมโมโมโมโมโมโมโมโมโมμοโมโมμοโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมโมμοโมโมโมโมโมโมमोμομοโมโมμοโมโมโมโมโมโมโมโมμοโม모모모모모모모โม모모모모모모모모모모모모모모모모모모모모โม모모моOCR काइन्स की सहायता से क्रमेकाएए एक एक किरोहोल की हो, PDF ফাইলে टेक्स्ट पहचान कर, मशीन-पഠनीसॉलरबहीहीहीहीतहीहीतहीहीहहथ्थेहहीहीहीहहहOCROCROCR

प्रोओपीरओहीहीहीतहीही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ही ह

  • OCR PDF में उनिमेनेनेनेनेनेनेनेनेनेमें
  • ओराओआओ आआओआओ में पीडीएफ में टेक्स्ट टेक्स्ट टेक्स्ट文本 टेक्स्ट टेक्स्ट टे टे टे टे टे те टे テ テ टे टे टे テ टे テ テ テ テ テ テ テ テ テ 테 テ テ テ テ テ テ テ テ テ テ 테 테 테 테 테 테 테 테 टे टे 테 टे 테 टे टे टे टे테 테 테 टे 테 테 테 टे टे टे テ टे टे टे टे टे टे टे टे 테 테 टे टे 테 टे 테 टे テ टे 테 टे 테テ테테 टे टे टे टे テ テ テ टे टे 테 テ 테 테 테 테 테 テ टे 테 테 테 테 टे टे 테 टे 테 테 टे 테

कुल मिलाकरसआरएहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीही

बेवाबेबेबेेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबे

टहहमेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबे

टमेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबेबे

  • हहीहीहीतहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीरहहीनह
  • टहीहीहीतहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीरींह
  • हरीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीरह
  • हजीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीहीरह

টহিহসস