Yeni AI ve Erişilebilirlik Güncellemeleri

Erişilebilirlik Farkındalık Günü’nü (GAAD) kutlamak amacıyla, Android ve Chrome için yeni güncellemelerin yanı sıra ekosistem için yeni kaynaklar sunmaktan mutluluk duyuyoruz. Yapay zekadaki gelişmeler, dünyamızı giderek daha erişilebilir hale getiriyor. Bugün, Küresel Erişilebilirlik Farkındalık Günü’nü kutlamak için Android ve Chrome ürünlerimize yeni güncellemeler sunuyoruz ve geliştiricilerin konuşma tanıma araçları oluşturmaları için yeni kaynaklar ekliyoruz.

Yapay Zeka Destekli Yeni Android Yenilikleri

Google AI ve Gemini’nin en iyi özelliklerini, görme ve işitme duyularına göre özelleştirilmiş temel mobil deneyimlere entegre etmeye yönelik çalışmalarımızı güçlendiriyoruz.

Gemini ve TalkBack ile Tüm Ayrıntıları Elde Edin

Geçtiğimiz yıl, Gemini’nin özelliklerini Android’in ekran okuyucusu TalkBack’e getirerek, görme engelli veya az gören kişilere, alternatif metin olmasa bile yapay zeka tarafından oluşturulan görüntü açıklamaları sunmuştuk. Bugün bu Gemini entegrasyonunu genişleterek, kişilerin sorular sorabilmesini ve görüntüler hakkında yanıtlar alabilmesini sağlıyoruz.

Bu, bir arkadaşınız size yeni gitarının bir fotoğrafını gönderdiğinde, markası ve rengi hakkında takip soruları sorabileceğiniz ve hatta görüntüde başka neler olduğunu sorabileceğiniz bir açıklamaya sahip olabileceğiniz anlamına geliyor. Artık insanlar, açıklamalar alabilir ve tüm ekranları hakkında soru sorabilirler. Bu nedenle, en sevdiğiniz alışveriş uygulamasında en son promosyonları satın alıyorsanız, Gemini’ye öğenin malzemesi veya indirim olup olmadığı hakkında ప్రశ్నlar sorabilirsiniz.

Daha detaylı söylemek gerekirse bu güncelleme, Gemini’nin gücünden yararlanarak görüntü açıklamalarını daha önce görülmemiş seviyelere taşıyor. Kullanıcılar artık statik açıklamalarla sınırlı kalmıyor; belirli sorular sorarak ve ayrıntılı yanıtlar alarak görüntülerle etkileşime geçebiliyor. Örneğin, kullanıcılar tarihi bir simge yapının fotoğrafını yükleyebilir ve mimari tarzı, inşa edildiği yıl veya diğer ilgili ayrıntılar hakkında bilgi alabilirler. Gemini’nin akıllı işlem yetenekleri, görüntüyü analiz edecek, ilgili bilgileri çıkaracak ve kolayca anlaşılır bir biçimde kapsamlı bir yanıt sağlayacaktır.

Buna ek olarak, Gemini’nin TalkBack ile entegrasyonu, basit görüntü tanımının ötesine geçiyor. Ayrıca, kullanıcıların cihazlarında görüntülenen bilgiler hakkında soru sormalarına olanak tanıyarak ekran içeriğine de genişliyor. Karmaşık bir web sayfasında gezinirken veya tanımadığınız bir uygulamayı kullanırken sorun yaşıyorsanız, TalkBack’i etkinleştirmeniz ve Gemini’den açıklama veya rehberlik istemeniz yeterlidir. Gemini, ekran içeriğini analiz edecek, temel öğeleri tanımlayacak ve açık ve öz bir şekilde açıklamalar veya talimatlar sağlayacaktır. Bu etkileşimli yaklaşım, görme engelli kullanıcıların dijital dünyada görülmemiş bir güven ve bağımsızlıkla gezinmesini sağlıyor.

Altyazıların Arkasındaki Daha Fazla Duyguyu Anlama

İfade Altyazıları sayesinde, telefonunuz, telefondaki çoğu uygulamadaki sesli her şey için gerçek zamanlı altyazılar sağlayabilir; yapay zeka kullanarak yalnızca birinin söylediklerini değil, aynı zamanda nasıl söylediklerini de yakalayabilir. İnsanların kendilerini ifade etme yollarından birinin kelimelerini uzatarak olduğunu biliyoruz, bu yüzden İfade Altyazılarında yeni bir süre özelliği डिवेलప్ ettik; böylece bir spor yayıncısının ne zaman “muhteşem şut” diye bağırdığını veya bir video mesajının “hayır” değil, “hayırrrr” olduğunu anlayabilirsiniz. Ayrıca daha fazla ses etiketi alacaksınız, böylece birinin ne zaman ıslık çaldığını veya boğazını temizlediğini anlayabileceksiniz. Bu yeni yayın, Android 15 ve sonraki sürümleri çalıştıran cihazlar için Amerika Birleşik Devletleri, Birleşik Krallık, Kanada ve Avustralya’da İngilizce olarak kullanıma sunuluyor.

Expressive Captions, altyazı deneyimini ince tonlamaları, konuşma hızını ve sesli ipuçlarını yakarlayarak kökten değiştirir. Şöyle düşünün: basit bir "tamam", kabulü, heyecanı veya alayı ifade etmek için kullanılabilir. Geleneksel altyazılar yalnızca kelimeleri kaydederken, Expressive Captions gizli duyguları çözümler ve bunları metin ipuçlarıyla izleyicilere iletir. Örneğin, bir iç çekiş hayal kırıklığını veya yorgunluğu gösterirken, kıkırdama eğlenceyi veya mutluluğu gösterebilir. Bu sözel olmayan ipuçlarını dahil ederek, Expressive Captions işitme engelli olan veya görsel yardımlara güvenmeyi tercih eden kişilerin izleme deneyimine derinlik ve bağlam katar.

Ek olarak, Expressive Capture’ın süre özelliği ise başka एक gerçekçilik ve katılım katmanı ekler. Kelimelerin uzaması ve uzunluğunu doğru bir şekilde yansıtarak altyazılar, konuşmacının duygusal yoğunluğunu ve önemini iletir. Uzayan "hayır!" terse, kısaca "hayır"dan daha fazla direnci belirtirken, uzayan bir "harika" heyecan ve hayranlığa katılır. Ayrıntıya gösterilen bu önem, altyazıları daha çekici, bilgilendirici ve etki yaratıcı hale getirerek izleyicilerle tükettikleri içerik arasında daha derin bağlar kurar.

Duygusal geliştirmelerin yanı sıra Expressive Captions, ıslık, kahkaha ve alkış gibi çeşitli sesli ipuçlarını belirlemek ve kodlamak için ses etiketleri içerir. Bu etiketler altyazılara bağlam katar ve izleyicilerin işitme duyuları kısıtlı olsa bile, ses ortamını tam olarak anlamalarını sağlar. Temel sesli öğeleri tespit ederek, Expressive Captions izleyicilerin tüket ettikleri içeriğe katılmasına ve anlamasına olanak tanır ve таким образом işitsel ve görsel bilgiler arasındaki farkı giderir.

Dünyanın Dört Bir Yanında Konuşma Tanımayı Geliştirme

2019’da, standart olmayan konuşmaya sahip kişiler için konuşma tanımayı daha erişilebilir hale getirmek için Euphonia प्रوجكتi başlatmıştık. Şimdi, bu çalışmayı daha fazla dile ve kültürel bağılamlara taşıdıkları için dünyanın dört bir yanındaki geliştiricileri ve kuruluşları destekliyoruz.

Yeni Geliştirici Kaynakları

Küresel araç ekosistemini iyileştirmek için, Euphonia प्रوجكتi’nin GitHub sayfası aracılığıyla geliştiricilere açık kaynak depomuzu sunuyoruz. Artık araştırma için özel ses araçları geliştirebilir veya modellerini farklı konuşma modellerine uyacak şekilde eğitebilirler.

Google, açık kaynaklı depoyu sağlayarak geliştiricilerin, araştırmacıların ve kuruluşların Euphonia प्रوجكتi’nin bir sonucu olan sonuçlardan faydalanmasına ve katkıda bulunmasına izin veriyor. Bu işbirlikçi yaklaşım, standart olmayan konuşma konuşma tanıma teknolojilerinin ilerlemesini hızlandırdı ve kullanılabilirliğinin çeşitli dil ve kültürel bağılamlara genişlemesini sağladı. Kod, veri kümelerini ve modelleri paylaşarak Google, вспомогательные teknolojilar için çığır açan çözümler oluşturarak yenilikçilik ve deney сообщество oluşturuyor.

Ayrıca, geliştirici kaynaklarının kullanılabilirliği, kişisel veya kuruluşların konuşma tanıma araçlarını belirli ihtiyaçlarını karşılamak için özelleştirmesini sağlıyor. Araştırmacılar, farklı konuşma modellerini araştırmak için ve çeşitli konuşma tarzlarından doğru şekilde kodlanabilen algoritmaları geliştirmek için bu kaynakları kullanabilirler. Yeni başlayanlar veya küçük işletmeler, kapsayıcılığını ve erişilebilirliğini iyileştirmek için aplikacalarına veya hizmetlerine entegre edebilirler. Google, konuşma tanıma teknolojisine giriş engelini azaltarak inovasyonu gerçekleştiriyor ve geliştiricilere ses bozukluğu olan kişilerin dünyayla iletişim kurmasını ve etkileşim kurmasını sağlayan anlamlı çözümler yaratma güçü veriyor.

Afrika’da Yeni ਪ੍ਰੋਜੈક્ટler Destekleme

Bu yılın başlarında, Londra Üniversitesi Koleji’nde Dijital Dil Kapsayıcılık Merkezi (CDLI) oluşturulmasını desteklemek için Google.org ile ortaklık kurduk. CDLI, 10 Afrika dilinde açık kaynaklı veri kümeleri oluşturarak, yeni konuşma tanıma modelleri oluşturarak ve ayrıca alandaki kuruluşları ve geliştirici ekosistemini desteklemeye devam ederek Afrika’da İngilizce konuşmayan kişiler için konuşma tanıma teknolojilerini geliştirmeye kendini adamıştır.

Google.org’un Dijital Dil Kapsayıcılık Merkezi’ne (CDLI) verdiği destek, şirketin Afrika dillerindeki teknolojik farklılıkları kapatma konusundaki kararlılığının kanıtıdır. Google, CDLI’ye fon ve kaynak sağlayarak Afrika kıtasında daha doğru ve kuşatıcı konuşma tanıma modelleri geliştirilmesine yardımcı oluyor. CDLI, Afrika dillerinde geniş ölçekte açık veri kümeleri oluşturmaya odaklanmıştır. Bu, sağlam konuşma tanıma sistemlerini eğitmek için önemli bir adımdır. CDLI, Afrika dillerinde konuşma örneklerini toplayarak ve açıklayarak, diline veya aksanlı olmasına bakılmaksızın konuşma tanıma teknolojisinin geleceğinin, Afrika halkının konuşmalarını doğru bir şekilde kodlayableceği bir geleceğin temelini atıyor.

Veri kümeleri oluşturmanın yanı sıra CDLI, özellikle Afrika dillerinin benzersiz dil özelliklerine göre tasarlanmış yeni konuşma tanıma modelleri oluşturmaya da çalışıyor. Bu modeller, genellikle İngilizce’den ve yaygın olarak çalışılan diğer dillerden farklı olan Afrika dillerinin tonlama varyasyonları, konuşma modelleri ve sözlüklerini dikkate alıyor. CDLI, konuşma tanıma modellerini Afrika dillerinin karmaşıklığına uyacak şekilde özelleştirerek Afrika halkını elde edebilme ve kullanabilme için konuşma tanıma teknolojisinin doğruluğunu ve güvenilirliğini artırıyor.

En önemlisi, CDLI Afrika kıtasındaki kuruluşları ve geliştiriciler ekosistemini desteklemeye odaklanıyor. CDLI, uzman bir topluluk inşa etmeye yardımcı olan eğitim programları, rehberlik fırsatları ve finansal kaynakları sağlıyor. Afrika’da dil teknolojilerinin ilerlemesini destekleyerek CDLI, Afrika halkı için ekonomik fırsatlar yaratıyor ve güçlü ve kuşatıcı bir dijital gelecek oluşturuyor.

Öğrenciler için Yardımcı Seçenekleri Genişletme

Yardımcı araçlar, engelli öğrenciler için özellikle faydalı, yüz hareketlerini kullanarak Chromebooklarında yüz kontrolleriyle gezinmelerinden, okuma deneyimlerini özelleştirmek için okuma modunu kullanmalarına kadar.

Artık öğrencilerinde SAT ve çoğu üniversite hazırlık kursu sınavlarına girebildiği üniversite konseyinin Bluebook test uygulamasını Chromebook’unuzda kullandığınızda, Google’ın tüm yerleşik yardımcı araçlarını kullanabileceksiniz. Buna ChromeVox ekran okuyucusu ve dikte etme, ayrıca üniversite konseyinin kendi dijital test araçları da dahildir.

İşte yardımcı araçların, farklı engelliliklere sahip öğrencilerin öğrenme deneyimlerini nasıl tamamen değiştirebildiği:

  • Görme engelli öğrenciler, ekrandaki metni sözlü olarak okuyabilen ChromeVox ekran okuyucusundan yararlanabilir, ve böylece göremiyor olsa bile yazılı içeriğe ulaşabilir. ChromeVox aynı zamanda resimler, düğmeler ve bağlantılar hakkında açıklamalar sağlayabilir, ve bu sayede öğrenciler İnternet ve uygulamalarda kolaygezinir.
  • Hareket kısıtlılığı olan öğrenciler, yüz ifadelerini kullanarak Chromebooklarında gezinmelerine olanak tanıyan ve yüz kontrollerini çok faydalı bulabilir. Bu eller serbest kontrol yöntemi, klavye veya fareyi geleneksel şekilde kullanamayan öğrenciler için oyun değiştirici olabilir.
  • Öğrenme güçlükleri yaşayan öğrenciler, okuma deneyimlerini özelleştirmek için okuma modunu kullanabilir. Okuma modu, öğrencilerin yazı tipi boyutunu, rengini ve aralığını ayarlamasına olanak tanır, и bu sayede metnin okunmasını daha kolay hale getirir. Ayrıca öğrenciler içeriğe odaklanabilmesi için resimler ve reklamlar gibi dikkat dağıtıcı unsurları da ortadan kaldırır.

Genel olarak, Google’ın yardımcı araçları, engelli öğrenciler için olasılıklar dolu bir dünya açıyor. Google, özelleştirilmiş erişim ve destek sağlayarak öğrencilerin engelleri aşmasını, yeteneklerini tam olarak gerçekleştirmesini ve akademik olarak başarılı olmasını sağlıyor.

Chrome’u Daha Kolay Ulaşılabilir Hale Getirme

Her gün 2 milyardan fazla insan Chrome kullanıyor ve tarayıcımızı kullanmanın daha kolay olması ve canlı altyazılar ve ekran okuyucu kullanıcıları için görüntü açıklamaları gibi özelliklerin herkesi kapsamasından daima eminiz.

Chrome’da PDF’lere Daha Kolay Erişim

Daha önce, masaüstü Chrome tarayıcısında taranmış bir PDF açtıysanız, ekran okuyucu ile etkileşime geçemezdiniz. Artık optik karakter tanıma (OCR) ile Chrome, bu tür PDF’leri otomatik olarak tanır, böylece diğer herhangi bir sayfada olduğu gibi metni vurgulayabilir, kopyalayabilir ve arayabilir ve bir ekran okuyucuyla okuyabilirsiniz.

Optik karakter tanıma (OCR) teknolojisinin entegrasyonu, görme bozukluğu olan kişilerin PDF dosyalarına erişme şeklini temelden değiştirdi veya ekran okuyucularını kullanmayı tercih eden kişiler için içeriklerini değiştirdi. Daha önce, taranmış PDF dosyaları ekran okuyucular için esasen erişilemezdi, çünkü makineler tarafından okunabilir metin değil, resimler olarak kabul edildiler. Bu, görme bozukluğu olan kişilerin taranmış PDF dosyalarındaki içeriği okuyamayacağı, arayamayacağı veya etkileşime geçemeyeceği anlamına geldi.

OCR teknolojisi sayesinde Chrome now taranmış PDF’leri otomatik olarak analiz edebilir, dosyalardaki metni tanımlayabilir ve makineler tarafından okunabilir bir biçime dönüştürebilir. Bu süreç, ekran okuyucunun PDF’deki metni okumasına olanak tanır ve sonuç olarak görme bozukluğu olan kişilerin dosyalara başka herhangi bir dijital belgede olduğu gibi erişmesini ve kullanmasını sağlar.

OCR entegrasyonunun faydaları çok yönlüdür:

  • Gelişmiş Erişilebilirlik: OCR, daha önce erişilemez olan taranmış PDF dosyalarını ekran okuyucularını kullanan kişilerin kolayca erişebilmesini sağlar. Bu, taranmış belgelere bağımsız olarak erişemeyen kişilerin kullanabileceği olasılıklar dolu bir dünya açar.
  • Gelişmiş Kullanıcı Deneyimi: OCR, kullanıcıların taranmış PDF dosyalarıyla başka herhangi bir dijital belgede olduğu gibi etkileşime geçmesini sağlar. Metni vurgulayabilir, bölümleri kopyalayabilir ve belirli kelimeleri veya ifadeleri arayabilir ve bu da okuma ve araştırma deneyimlerini geliştirir.
  • Daha Yüksek Verimlilik: OCR, taranmış PDF dosyalarındaki metni manuel olarak çevirme gereksinimini ortadan kaldırır. Bu, zamandan ve emekten tasarruf sağlar ve kullanıcıların bilgiye erişmeye çalışmak yerine ele aldıkları göreve odaklanmalarına olanak tanır.

Genel olarak Chrome’a OCR teknolojisinin entegre edilmesi, görme bozukluğu olan kişiler için PDF dosyalarına erişimin daha kolay hale getirmesi için büyük bir ilerlemedir. Daha önce erişilemez olan belgeleri aranabilir, okunabilir ve etkileşimli hale getirerek Chrome, okuma ve öğrenme konusunda zorluklarla karşılaşan kişiler arasındaki dijital uçurumu kapatmaya yardımcı oluyor.

Sayfa Yakınlaştırma ile Kolay Okuma

Sayfa yakınlaştırma artık Android’deki Chrome’da, masaüstü Chrome’da çalıştığı gibi, bir web sayfasının düzenini veya tarama deneyiminizi etkilemeden gördüğünüz metnin boyutunu artırmanızı sağlar. Ne kadar yakınlaştırmak istediğinizi özelleştirebilir ve tercihlerinizi ziyaret ettiğiniz tüm sayfalara veya yalnızca belirli sayfalara kolayca uygulayabilirsiniz.

Sayfa yakınlaştırma özelliği, daha iyi görmek isteyen veya daha kolay okuyabilmek için daha büyük metinler arayan kişiler için bir olasılıklar dünyası demektir. Chrome, kullanıcıların bir web sayfasının düzenini etkilemeden metin boyutunu ayarlamasına izin vererek, metnin görsel olarak daha rahat, okunması daha kolay ve metinlerin üst üste gelmesi veya biçimlendirmenin bozulması tehlikesi olmadan olmasını sağlar.

Sayfa yakınlaştırma özelliğinin sahip olduğu başlıca faydalar şunlardır:

  • Geliştirilmiş Okuma Kolaylığı: Sayfa yakınlaştırma, kullanıcıların gördükleri metnin boyutunu ayarlamasını sağlar ve bu da okumayı daha rahat ve daha keyifli hale getirir. Görme bozukluğu olan, disleksi olan veya diğer görme sorunları olan kişiler için özellikle faydalıdır.
  • Geliştirilmiş Rahatlık: Sayfa yakınlaştırma, kullanıcıların metin boyutunu kişisel tercihlerine ve görme gereksinimlerine uyacak şekilde özelleştirmesini sağlar. Bu, göz yorgunluğunu azaltmaya yardımcı olur ve daha uzun süreli içeriklerin de daha rahat okunmasını sağlar.
  • Düzenin Korunması: Tüm web sayfasını basitçe ölçeklendirme yerine sayfa yakınlaştırma özelliği, yalnızca kullanım şekillerini korurken, kullanıcıların metin boyutunu artırmasına ve azaltmasına izin verir. Бунун garantisi, web sayfasında da kolay gezinilebilir ve tüm öğelerin beklendiği gibi yerleştirilebilir olmasıdır.
  • Esnek Özelleştirme: Sayfa yakınlaştırma, kullanıcıların metin boyutunu belirli gereksinimlerini karşılayacak şekilde ayarlamasınlara olanak tanıyan geniş bir özelleştirme seçeneklerini sunar. Kullanıcılar, önceden tanımlanmış yakınlaştırma düzeylerini seçebilir veya özel değerler girebilir এবং belirli tercihlerini tüm web sayfalarına veya yalnızca belirli web sitelerine uygulayabilirler.

Bu özelliği kullanmaya başlamak için Chrome sağ üst köşesindeki üç nokta menüsüne tıklayın ve ardından yakınlaştırma tercihlerinizi ayarlayın.