تحديثات الذكاء الاصطناعي وإمكانيات الوصول الجديدة

احتفالًا باليوم العالمي للتوعية بإمكانيات الوصول (GAAD)، يسعدنا تقديم تحديثات جديدة لنظامي التشغيل Android و Chrome، بالإضافة إلى موارد جديدة لنظامنا البيئي. إن التقدم في الذكاء الاصطناعي يجعل عالمنا في ازدياد مستمر من حيث إمكانية الوصول. واليوم، احتفالًا باليوم العالمي للتوعية بإمكانيات الوصول، نطلق تحديثات جديدة لمنتجات Android و Chrome، بالإضافة إلى موارد جديدة للمطورين لبناء أدوات التعرف على الكلام.

المزيد من الابتكارات التي تعمل بالذكاء الاصطناعي لنظام Android

نحن نعمل على تعزيز جهودنا ودمج أفضل ميزات Google AI و Gemini في تجارب الهاتف المحمول الأساسية المخصصة للرؤية والسمع.

احصل على جميع التفاصيل من خلال Gemini و TalkBack

في العام الماضي، قدمنا إمكانات Gemini إلى TalkBack، قارئ الشاشة لنظام Android، لتوفير أوصاف للصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي للأشخاص المكفوفين أو ضعاف البصر، حتى في حالة عدم وجود نص بديل. اليوم، نقوم بتوسيع هذا التكامل بين Gemini لكي يتمكن المستخدمون من طرح أسئلة وتلقي إجابات حول صورهم.

هذا يعني أنه في المرة القادمة التي يرسل لك فيها صديق صورة لغيتاره الجديد، يمكنك الحصول على وصف، وطرح أسئلة للمتابعة حول العلامة التجارية واللون، وحتى ما هو موجود أيضًا في الصورة. يمكن للأشخاص الآن أيضًا الحصول على أوصاف وطرح أسئلة حول شاشتهم بأكملها. لذلك، إذا كنت تتسوق بحثًا عن أحدث العروض الترويجية على تطبيق التسوق المفضل لديك، فيمكنك أن تسأل Gemini عن مادة المنتج أو ما إذا كان هناك خصم.

بشكل أكثر تحديدًا، يرتقي هذا التحديث بأوصاف الصور إلى مستويات غير مسبوقة من خلال الاستفادة من قوة Gemini. لم يعد المستخدمون مقيدين بأوصاف ثابتة؛ يمكنهم التفاعل مع الصور وطرح أسئلة محددة وتلقي إجابات دقيقة ومفصلة. على سبيل المثال، يمكن للمستخدم تحميل صورة لمعلم تاريخي وسؤاله عن أسلوبه المعماري أو سنة بنائه أو أي تفاصيل أخرى ذات صلة. ستقوم قدرات المعالجة الذكية في Gemini بتحليل الصورة واستخراج المعلومات ذات الصلة وتقديم استجابة شاملة بتنسيق سهل الفهم.

علاوة على ذلك، يتجاوز تكامل Gemini مع TalkBack مجرد التعرف على الصور. ويمتد أيضًا إلى محتوى الشاشة، مما يسمح للمستخدمين بطرح أسئلة حول المعلومات المعروضة على أجهزتهم. إذا كنت تواجه صعوبة في التنقل في صفحة ويب معقدة أو استخدام تطبيق غير مألوف، فيمكنك ببساطة تنشيط TalkBack وطرح Gemini للحصول على توضيحات أو إرشادات. سيقوم Gemini بتحليل محتوى الشاشة وتحديد العناصر الأساسية وتقديم تفسيرات أو إرشادات بطريقة واضحة وموجزة. يمكّن هذا النهج التفاعلي المستخدمين ذوي الإعاقة البصرية من التنقل في العالم الرقمي بثقة واستقلالية غير مسبوقة.

فهم المزيد من المشاعر وراء الترجمة المصاحبة

مع التسميات التوضيحية التعبيرية، يمكن لهاتفك توفير ترجمات مصاحبة في الوقت الفعلي لأي شيء يصدر صوتًا في معظم التطبيقات الموجودة على هاتفك - باستخدام الذكاء الاصطناعي لالتقاط ليس فقط ما يقوله شخص ما، ولكن أيضًا الطريقة التي يتحدث بها. نحن نعلم أن إحدى الطرق التي يعبر بها الناس عن أنفسهم هي عن طريق إطالة صوت كلماتهم، ولهذا السبب قمنا بتطوير ميزة المدة الجديدة في التسميات التوضيحية التعبيرية حتى تتمكن من معرفة متى يصرخ مذيع رياضي قائلاً "تسديدة راااائعة" أو أن الرسالة ليست "لا" ولكنها "لااااا". ستتلقى أيضًا المزيد من الملصقات الصوتية حتى تتمكن من معرفة متى يصفر شخص ما أو ينظف حلقه. يتم طرح هذا الإصدار الجديد باللغة الإنجليزية في الولايات المتحدة والمملكة المتحدة وكندا وأستراليا على الأجهزة التي تعمل بنظام Android 15 والإصدارات الأحدث.

تعمل التسميات التوضيحية التعبيرية على إحداث ثورة في تجربة الترجمة المصاحبة من خلال التقاط الاختلافات الدقيقة في النبرة وسرعة الكلام والإشارات الصوتية. فكر في الأمر: يمكن التعبير عن الموافقة أو الإثارة أو السخرية كلها بكلمة بسيطة "حسنًا". في حين أن التسميات التوضيحية التقليدية تسجل الكلمات فقط، فإن التسميات التوضيحية التعبيرية تترجم المشاعر الكامنة وتنقلها إلى الجمهور من خلال تلميحات نصية. على سبيل المثال، قد يشير التنهد إلى الإحباط أو التعب، في حين أن الضحك قد يشير إلى الترفيه أو المرح. من خلال تضمين هذه الإشارات غير اللفظية، يمكن للتسميات التوضيحية التعبيرية إضافة عمق وسياق إلى تجربة المشاهدة للأفراد الذين يعانون من ضعف السمع أو يفضلون الاعتماد على المعينات البصرية.

علاوة على ذلك، تضيف ميزة المدة في التسميات التوضيحية التعبيرية طبقة أخرى من الأصالة والمشاركة. من خلال عكس إطالة الكلمات وتمديدها بدقة، تنقل التسميات التوضيحية القوة العاطفية والأهميةالتي يعلقها المتحدث. ينقل "لا!" الممتد قدرًا أكبر من المقاومة مقارنة بـ "لا" موجزة، في حين أن "رائع" المسحوب يثير الإثارة والرهبة. هذا الاهتمام بالتفاصيل يجعل التسميات التوضيحية أكثر جاذبية وغنية بالمعلومات ورنانة، مما يعزز اتصالاً أعمق بين الجمهور والمحتوى الذي يستهلكونه.

بالإضافة إلى التحسينات العاطفية، تتضمن التسميات التوضيحية التعبيرية أيضًا علامات صوتية لتحديد وتسجيل مجموعة متنوعة من الإشارات الصوتية، مثل الصفير والضحك والتصفيق. تضيف هذه العلامات سياقًا إلى الترجمة المصاحبة وتمكن المشاهدين من فهم البيئة الصوتية تمامًا، حتى لو كانت قدرتهم على السمع محدودة. من خلال تحديد العناصر الصوتية الرئيسية، تتيح التسميات التوضيحية التعبيرية للمشاهدين المشاركة في المحتوى الذي يستهلكونه وفهمه، مما يسد الفجوة بين المعلومات السمعية والمرئية.

تحسين التعرف على الكلام في جميع أنحاء العالم

في عام 2019، أطلقنا مشروع Euphonia لإيجاد طرق لجعل التعرف على الكلام أكثر سهولة للأشخاص الذين لديهم كلام غير قياسي. الآن، نحن ندعم المطورين والمؤسسات في جميع أنحاء العالم أثناء قيامهم بتطبيق هذا العمل في المزيد من اللغات والسياقات الثقافية.

موارد مطور جديدة

لتحسين النظام البيئي للأدوات على مستوى العالم، نوفر للمطورين مستودعاتنا مفتوحة المصدر من خلال صفحة GitHub الخاصة بمشروع Euphonia. يمكنهم الآن تطوير أدوات صوتية مخصصة للبحث، أو تدريب نماذجهم للتكيف مع أنماط كلام مختلفة.

من خلال توفير مستودعات مفتوحة المصدر، تسمح Google للمطورين والباحثين والمؤسسات بالاستفادة من نتائج مشروع Euphonia والمساهمة فيها. يسرع هذا النهج التعاوني من تقدم تقنيات التعرف على الكلام للكلام غير القياسي، مما يضمن إمكانية توسيع نطاق توفره ليشمل مجموعة واسعة من اللغات والسياقات الثقافية. من خلال مشاركة التعليمات البرمجية ومجموعات البيانات والنماذج، تعمل Google على تعزيز مجتمع من الابتكار والتجريب، مما يؤدي إلى حلول مبتكرة للتكنولوجيا المساعدة.

علاوة على ذلك، يتيح توفر موارد المطورين للأفراد أو المؤسسات تخصيص أدوات التعرف على الكلام لتلبية احتياجاتهم الخاصة. يمكن للباحثين الاستفادة من هذه الموارد للتحقيق في أنماط الكلام المختلفة وتطوير خوارزميات يمكنها نسخ مجموعة واسعة من طرق التحدث بدقة. يمكن للشركات الناشئة أو الشركات الصغيرة دمجها في تطبيقاتها أو خدماتها لتعزيز إمكانية الوصول والشمولية. من خلال خفض حاجز الدخول إلى تقنية التعرف على الكلام، تعمل Google على تمكين الابتكار وتمكين المطورين من إنشاء حلول مفيدة تمكن الأشخاص ذوي الإعاقة الكلامية من التواصل والتفاعل مع العالم.

دعم المشاريع الجديدة في أفريقيا

في وقت سابق من هذا العام، دخلنا في شراكة مع Google.org لتقديم الدعم لجامعة كاليفورنيا في لندن لإنشاء مركز إدماج اللغات الرقمية (CDLI). يكرس مركز إدماج اللغات الرقمية (CDLI) جهوده لتحسين التعرف على الكلام للأفراد الناطقين بلغات غير الإنجليزية في إفريقيا من خلال إنشاء مجموعات بيانات مفتوحة المصدر لـ 10 لغات إفريقية وإنشاء نماذج جديدة للتعرف على الكلام والاستمرار في دعم نظام المؤسسات والمطورين في هذا المجال.

إن دعم Google.org لمركز إدماج اللغات الرقمية (CDLI) هو شهادة على التزام الشركة بسد الفجوة التكنولوجية في اللغات في إفريقيا. من خلال توفير التمويل والموارد لمركز إدماج اللغات الرقمية (CDLI)، تساعد Google في تطوير نماذج للتعرف على الكلام أكثر دقة وشمولية في القارة الأفريقية. يمثل تركيز مركز إدماج اللغات الرقمية (CDLI) على إنشاء مجموعات بيانات مفتوحة كبيرة للغات الأفريقية خطوة حاسمة إلى الأمام في تدريب أنظمة قوية للتعرف على الكلام. من خلال جمع عينات صوتية للغات الأفريقية وتدوينها، يضع مركز إدماج اللغات الرقمية (CDLI) الأساس لمستقبل تقنية التعرف على الكلام التي يمكنها نسخ كلام الأفارقة بدقة، بغض النظر عن لغتهم أو لهجتهم.

بالإضافة إلى إنشاء مجموعات البيانات، يكرس مركز إدماج اللغات الرقمية (CDLI) جهوده لإنشاء نماذج جديدة للتعرف على الكلام مصممة خصيصًا للميزات اللغوية الفريدة للغات الأفريقية. تأخذ هذه النماذج في الاعتبار التغيرات اللغوية ونماذج الكلام والمفردات للغات الأفريقية، والتي تختلف غالبًا عن اللغة الإنجليزية وغيرها من اللغات التي تمت دراستها على نطاق واسع. من خلال تخصيص نماذج التعرف على الكلام لتناسب تعقيدات اللغات الأفريقية، يعمل مركز إدماج اللغات الرقمية (CDLI) على تحسين دقة وموثوقية تقنية التعرف على الكلام، حتى يتمكن الناس في إفريقيا من الوصول إليها واستخدامها.

والأهم من ذلك، أن مركز إدماج اللغات الرقمية (CDLI) يركز على دعم نظام المؤسسات والمطورين في جميع أنحاء القارة الأفريقية. يوفر مركز إدماج اللغات الرقمية (CDLI) برامج تدريب وفرص إرشاد وموارد مالية للمساعدة في بناء مجتمع ماهر من الخبراء. من خلال تعزيز التقدم في تكنولوجيا اللغات الأفريقية، يخلق مركز إدماج اللغات الرقمية (CDLI) فرصًا اقتصادية للأفارقة ويبني مستقبلًا رقميًا قويًا وشاملاً.

توسيع خيارات إمكانية الوصول للطلاب

تعد أدوات إمكانية الوصول مفيدة بشكل خاص للطلاب ذوي الإعاقة، بدءًا من استخدام إيماءات الوجه للتنقل في أجهزة Chromebook الخاصة بهم من خلال Face Switch إلى استخدام وضع القراءة لتخصيص تجربة القراءة الخاصة بهم.

الآن، عند استخدام تطبيق Bluebook للاختبار التابع لمجلس الكلية (حيث يمكن للطلاب إجراء اختبار SAT ومعظم اختبارات الدورات المتقدمة بالكلية) على جهاز Chromebook، ستتمكن من استخدام جميع ميزات إمكانية الوصول المدمجة في Google. يتضمن ذلك قارئ الشاشة ChromeVox والإملاء، بالإضافة إلى أدوات الاختبار الرقمية الخاصة بمجلس الكلية.

إليك كيف يمكن لإمكانيات الوصول أن تُحدث ثورة في تجارب التعلم للطلاب ذوي الإعاقات المختلفة:

  • يمكن للطلاب ذوي الإعاقة البصرية الاستفادة من قارئ الشاشة ChromeVox، الذي يقرأ النص الموجود على الشاشة بصوت عالٍ، مما يتيح لهم الوصول إلى المحتوى المكتوب حتى إذا لم يتمكنوا من رؤيته. يمكن لـ ChromeVox أيضًا توفير أوصاف للصور والأزرار والروابط، مما يتيح للطلاب التنقل في الويب والتطبيقات بسلاسة.
  • قد يجد الطلاب الذين يعانون من ضعف الحركة أن ميزة التحكم في الوجه في Face Switch مفيدة جدًا، حيث تسمح لهم بالتنقل في أجهزة Chromebook الخاصة بهم باستخدام تعابير الوجه، مثل الابتسام أو رفع الحاجب. يمكن أن تكون طريقة التحكم بدون استخدام اليدين هذه بمثابة تغيير لقواعد اللعبة للطلاب غير القادرين على استخدام لوحة المفاتيح أو الماوس بالطرق التقليدية.
  • يمكن للطلاب الذين يعانون من صعوبات في التعلم استخدام وضع القراءة لتخصيص تجربة القراءة الخاصة بهم. يتيح وضع القراءة للطلاب ضبط الخط والحجم واللون والتباعد، مما يجعل من السهل عليهم قراءة النص. يمكنه أيضًا إزالة عوامل التشتيت، مثل الصور والإعلانات، مما يسمح للطلاب بالتركيز على المحتوى.

بشكل عام، تفتح أدوات إمكانية الوصول في Google عالمًا من الاحتمالات للطلاب ذوي الإعاقة. من خلال توفير الوصول والدعم المخصصين، تمكن هذه الأدوات الطلاب من التغلب على الحواجز وتحقيق إمكاناتهم الكاملة والنجاح أكاديميًا.

جعل Chrome أكثر سهولة

يستخدم Chrome أكثر من ملياري شخص يوميًا، ونحن ملتزمون دائمًا بجعل متصفحنا أكثر سهولة في الاستخدام وجعل ميزات مثل الترجمة المصاحبة في الوقت الفعلي وأوصاف الصور لمستخدمي قارئ الشاشة متاحة للجميع.

سهولة الوصول إلى ملفات PDF على Chrome

في السابق، إذا فتحت ملف PDF ممسوح ضوئيًا في متصفح Chrome لسطح المكتب، فلن تتمكن من التفاعل معه باستخدام قارئ الشاشة. أصبح الآن، مع التعرف الضوئي على الأحرف (OCR)، يمكن لـ Chrome التعرف تلقائيًا على هذه الأنواع من ملفات PDF، لذا يمكنك تمييز النص ونسخه والبحث عنه، وقراءته باستخدام قارئ الشاشة كما تفعل مع أي صفحة أخرى.

أحدث دمج تقنية التعرف الضوئي على الأحرف (OCR) ثورة في الطريقة التي يتفاعل بها الأفراد ذوو الإعاقة البصرية أو الذين يفضلون استخدام قارئ الشاشة للوصول إلى المحتوى، مع ملفات PDF. في السابق، كانت ملفات PDF الممسوحة ضوئيًا غير قابلة للوصول بشكل أساسي إلى قراء الشاشة لأنها تعامل كصور بدلاً من نص قابل للقراءة آليًا. هذا يعني أن الأفراد ذوي الإعاقة البصرية لم يتمكنوا من قراءة محتوى ملفات PDF الممسوحة ضوئيًا أو البحث فيه أو التفاعل معه.

باستخدام تقنية OCR، يمكن لـ Chrome الآن تحليل ملفات PDF الممسوحة ضوئيًا تلقائيًا وتحديد النص الموجود في الملف وتحويله إلى تنسيق قابل للقراءة آليًا. تتيح هذه العملية لقراء الشاشة قراءة النص الموجود في ملف PDF، مما يتيح للأفراد ذوي الإعاقة البصرية الوصول إلى هذه الملفات واستخدامها تمامًا مثل أي مستند رقمي آخر.

مزايا تكامل OCR متعددة:

  • إمكانية وصول محسّنة: تتيح OCR الوصول إلى ملفات PDF الممسوحة ضوئيًا والتي كانت غير قابلة للوصول سابقًا للأفراد الذين يستخدمون قراء الشاشة. يفتح هذا عالمًا من الاحتمالات للأفراد غير القادرين على الوصول إلى المستندات الممسوحة ضوئيًا بشكل مستقل.
  • تجربة مستخدم محسّنة: تتيح OCR للمستخدمين التفاعل مع ملفات PDF الممسوحة ضوئيًا بنفس الطريقة التي يتفاعلون بها مع أي مستند رقمي آخر. يمكنهم تمييز النص ونسخ الأقسام والبحث عن كلمات أو عبارات محددة، مما يعزز تجربة القراءة والبحث الخاصة بهم.
  • كفاءة أعلى: تلغي OCR الحاجة إلى نسخ النص الموجود في ملفات PDF الممسوحة ضوئيًا يدويًا. هذا يوفر الوقت والجهد، مما يسمح للمستخدمين بالتركيز على المهمة التي بين أيديهم بدلاً من محاولة الوصول إلى المعلومات.

باختصار، يعد دمج تقنية OCR في Chrome تقدمًا كبيرًا يجعل الوصول إلى ملفات PDF أسهل للأفراد ذوي الإعاقة البصرية. من خلال جعل المستندات التي كانت غير قابلة للوصول سابقًا قابلة للبحث والقراءة والتفاعل معها، تساعد Chrome في سد الفجوة الرقمية بين الأفراد الذين يواجهون تحديات في القراءة والتعلم.

سهولة القراءة باستخدام تكبير الصفحة

يتيح لك تكبير الصفحة الآن زيادة حجم النص الذي تراه في Chrome على نظام Android دون التأثير على تخطيط صفحة الويب أو تجربة التصفح - تمامًا كما هو الحال في Chrome لسطح المكتب. يمكنك تخصيص مقدار التكبير الذي تريده، وتطبيق تفضيلاتك بسهولة على جميع الصفحات التي تزورها أو على صفحات معينة فقط.

يمكن أن تكون ميزة تكبير الصفحة بمثابة تغيير لقواعد اللعبة للأفراد الذين يعانون من ضعف البصر أو أولئك الذين يفضلون حجم نص أكبر للحصول على وضوح أفضل وسهولة أكبر في القراءة. من خلال السماح للمستخدمين بضبط حجم النص دون التأثير على تخطيط صفحة الويب، تضمن Chrome أن يكون النص أكثر راحة من الناحية المرئية وأسهل في القراءة دون التعرض لخطر النص المتداخل أو تنسيق معطّل.

مزايا ميزة تكبير الصفحة هي كما يلي:

  • إمكانية قراءة محسّنة: يتيح تكبير الصفحة للمستخدمين ضبط حجم النص الذي يرونه، مما يجعله أسهل وأكثر متعة في القراءة. هذا مفيد بشكل خاص للأفراد الذين يعانون من ضعف البصر أو عسر القراءة أو غير ذلك من الإعاقات البصرية.
  • راحة محسّنة: يتيح تكبير الصفحة للمستخدمين تخصيص حجم النص ليناسب تفضيلاتهم ومتطلباتهم البصرية الفردية. يساعد هذا في تقليل إجهاد العين ويجعل قراءة المحتوى الأطول أكثر راحة.
  • تخطيط محفوظ: على عكس مجرد تكبير صفحة الويب بأكملها، يسمح تكبير الصفحة للمستخدمين بتكبير حجم النص أو تصغيره فقط مع الحفاظ على سلامة التخطيط الأصلي. يضمن ذلك سهولة التنقل في صفحة الويب ووضع جميع العناصر على النحو المنشود.
  • تخصيص مرن: يوفر تكبير الصفحة مجموعة واسعة من خيارات التخصيص، مما يسمح للمستخدمين بضبط حجم النص بدقة لتلبية احتياجاتهم الخاصة.