جوجل تعزز أندرويد وكروم بأدوات الذكاء الاصطناعي

فهم الصور المدعوم بالذكاء الاصطناعي مع TalkBack

في العام الماضي، اتخذت Google خطوة مهمة من خلال دمج قدرات Gemini في TalkBack، مما يتيح للأفراد الذين يعانون من ضعف الرؤية الوصول إلى الأوصاف التي تم إنشاؤها بواسطة الذكاء الاصطناعي للصور، حتى في حالة عدم وجود نص Alt. بالاعتماد على هذا الأساس، يمكن للمستخدمين الآن التفاعل مع الصور على مستوى أعمق من خلال طرح الأسئلة وتلقي استجابات ثاقبة حول محتواها.

ضع في اعتبارك السيناريو الذي يرسل فيه صديق صورة لجيتاره الجديد. باستخدام TalkBack المحسن، لا يمكنك فقط تلقي وصف للأداة ولكن أيضًا الاستعلام عن علامتها التجارية ولونها، واكتساب فهم شامل للصورة.

علاوة على ذلك، تمتد هذه الوظيفة إلى شاشة الهاتف بأكملها. تخيل أنك تتصفح تطبيق تسوق عبر الإنترنت. يمكنك الآن أن تسأل Gemini عن مادة عنصر معين أو ما إذا كانت هناك أي خصومات متاحة حاليًا، مما يبسط تجربة التسوق الخاصة بك ويوفر معلومات قيمة في متناول يدك.

ترجمات تعبيرية: التقاط الفروق الدقيقة والعاطفة

أعلنت Google أيضًا عن تحديث لـ Expressive Captions، وهي ميزة الترجمة في الوقت الفعلي من Android. من خلال تسخير قوة الذكاء الاصطناعي، لا تقوم Expressive Captions فقط بنسخ ما يقال ولكنها تلتقط أيضًا الفروق الدقيقة والعواطف التي تنقلها الكلمات.

إدراكًا لحقيقة أن الأشخاص غالبًا ما يعبرون عن أنفسهم عن طريق إطالة أصوات كلماتهم، فقد قدمت Google ميزة مدة جديدة في Expressive Captions. تتيح هذه الميزة للمستخدمين تمييز التركيز والعاطفة الكامنة وراء الكلمات المنطوقة. على سبيل المثال، ستتمكن من التمييز بين معلق رياضي يصرخ "تسديدة رائعة" وشخص يقول ببساطة "لااااا" للتعبير عن خيبة أمل قوية.

بالإضافة إلى المدة، يقدم التحديث تسميات جديدة للأصوات، مثل الصفير أو تنحنح الحلق، مما يوفر تجربة ترجمة أكثر اكتمالاً وغنية بالمعلومات.

تتوفر ميزة Expressive Captions المحدثة حاليًا باللغة الإنجليزية في الولايات المتحدة والمملكة المتحدة وكندا وأستراليا للأجهزة التي تعمل بنظام Android 15 والإصدارات الأحدث.

إمكانية وصول مُحسّنة إلى ملفات PDF على Chrome

تلتزم Google أيضًا بتحسين إمكانية الوصول إلى ملفات PDF داخل متصفح Chrome. في السابق، لم يتمكن المستخدمون من التفاعل مع ملفات PDF الممسوحة ضوئيًا باستخدام قارئات الشاشة على متصفح Chrome لسطح المكتب. ومع ذلك، مع هذا التحديث، يتعرف Chrome الآن تلقائيًا على هذه الأنواع من ملفات PDF، مما يتيح للمستخدمين تمييز النص ونسخه والبحث عنه، تمامًا كما يفعلون في أي صفحة ويب أخرى. يتم تشغيل هذه الوظيفة من خلال دمج تقنية التعرف البصري على الأحرف (OCR).

يعمل هذا التحسين على تحسين إمكانية الوصول إلى المستندات الممسوحة ضوئيًا بشكل كبير، مما يجعلها أكثر قابلية للاستخدام للأفراد الذين يعانون من ضعف البصر.

تكبير الصفحة القابل للتخصيص على Chrome لنظام Android

إضافة أخرى بارزة إلى Chrome على نظام Android هي ميزة تكبير الصفحة المحسّنة. تتيح هذه الميزة للمستخدمين زيادة حجم النص على صفحات الويب دون تعطيل التخطيط العام.

يمكن للمستخدمين تخصيص مستوى التكبير/التصغير حسب تفضيلاتهم وتطبيقه على جميع صفحات الويب التي يزورونها أو تحديد صفحات معينة. يمكن الوصول إلى هذه الميزة من خلال قائمة النقاط الثلاث في الزاوية العلوية اليمنى من Chrome.

نظرة مُتعمّقة على الميزات الجديدة

يمثل تقديم هذه الميزات خطوة مهمة إلى الأمام في التزام Google المستمر بإمكانية الوصول والابتكار المُوجّه بالذكاء الاصطناعي. من خلال دمج الذكاء الاصطناعي بسلاسة في الأدوات الحالية وتقديم وظائف جديدة، تعمل Google على تمكين المستخدمين من التفاعل مع التكنولوجيا بطرق أكثر سهولة ويسر.

إمكانات الذكاء الاصطناعي في Accessibility

يسلط دمج Gemini في TalkBack الضوء على الإمكانات الهائلة للذكاء الاصطناعي في تعزيز إمكانية الوصول للأفراد الذين يعانون من ضعف البصر. من خلال توفير أوصاف مُنشأة بالذكاء الاصطناعي للصور وتمكين المستخدمين من طرح الأسئلة حول محتواها، تطلق Google مستوى جديدًا من الاستقلالية والوصول إلى المعلومات.

يمكن أن تكون هذه التقنية ذات قيمة خاصة في الحالات التي يكون فيها نص Alt غير متوفر أو غير كافٍ، مما يسمح للمستخدمين باكتساب فهم أعمق للمحتوى المرئي.

Expressive Captions: ما وراء النسخ البسيط

تتجاوز ميزة Expressive Captions المُحدّثة النسخ البسيط من خلال التقاط الفروق الدقيقة والعواطف التي تنقلها الكلمات. يمكن أن تكون هذه الميزة مفيدة بشكل خاص للأفراد الصم أو ضعاف السمع، لأنها توفر سياقًا ومعلومات إضافية قد يتم تفويتها في الترجمات التقليدية.

إن تضمين مدة التسمية وتسميات الصوت يزيد من دقة الترجمة وغناها بالمعلومات، مما يجعلها أداة أكثر قيمة للتواصل.

تبسيط إمكانية الوصول إلى ملفات PDF

تعالج إمكانية الوصول المُحسّنة إلى ملفات PDF في Chrome تحديًا طال أمده للأفراد الذين يعانون من ضعف البصر. من خلال التعرف تلقائيًا على ملفات PDF الممسوحة ضوئيًا وتمكين قارئات الشاشة من التفاعل معها، تجعل Google هذه المستندات أكثر سهولة في الوصول إليها وقابلة للاستخدام.

يعد هذا التحديث مهمًا بشكل خاص في العصر الرقمي الحالي، حيث يتم توزيع العديد من المستندات بتنسيق PDF.

تكبير الصفحة: تجربة عرض قابلة للتخصيص

توفر ميزة تكبير الصفحة القابلة للتخصيص في Chrome لنظام Android للمستخدمين تحكمًا أكبر في تجربة العرض الخاصة بهم. من خلال السماح للمستخدمين بضبط حجم النص دون التأثير على تخطيط صفحة الويب، تلبي Google مجموعة واسعة من التفضيلات والاحتياجات البصرية.

يمكن أن تكون هذه الميزة مفيدة بشكل خاص للأفراد الذين يعانون من ضعف البصر أو أولئك الذين يفضلون قراءة النص بحجم أكبر.

التزام Google المستمر بالابتكار

تُظهر هذه الميزات الجديدة التزام Google الراسخ بالابتكار وإمكانية الوصول. من خلال تجاوز حدود التكنولوجيا باستمرار، تعمل Google على إنشاء عالم أكثر شمولاً ويسهل الوصول إليه للجميع.

إن دمج الذكاء الاصطناعي في الأدوات الحالية وإدخال وظائف جديدة يمهدان الطريق لمستقبل تمكّن فيه التكنولوجيا الأفراد من التغلب على الحواجز وتحقيق إمكاناتهم الكاملة.

مستقبل إمكانية الوصول

توفر التطورات التي أعلنت عنها Google لمحة عن مستقبل إمكانية الوصول. مع استمرار تطور تكنولوجيا الذكاء الاصطناعي، يمكننا أن نتوقع رؤية حلول أكثر ابتكارًا تعالج احتياجات الأفراد ذوي الإعاقة.

بدءًا من المساعدين المدعومين بالذكاء الاصطناعي الذين يمكنهم التنقل في العالم المادي وحتى تجارب التعلم المخصصة التي تلبي الاحتياجات الفردية، الاحتمالات لا حصر لها.

دور Google في تشكيل المستقبل

تلعب Google دورًا حاسمًا في تشكيل مستقبل إمكانية الوصول. من خلال الاستثمار في البحث والتطوير، والتعاون مع خبراء إمكانية الوصول، ودمج إمكانية الوصول في منتجاتها وخدماتها، تضع Google معيارًا للصناعة.

يعمل التزام Google بإمكانية الوصول كمصدر إلهام للشركات والمؤسسات الأخرى لإعطاء الأولوية للشمولية وإنشاء عالم أكثر سهولة للجميع.

التطبيقات والفوائد العملية

تترجم الميزات المفصلة أعلاه إلى فوائد ملموسة للمستخدمين في سيناريوهات مختلفة.

تعزيز التفاعل الاجتماعي

تخيل تلقي صورة من صديق. باستخدام TalkBack المدعوم بالذكاء الاصطناعي، يمكن للمستخدمين ضعاف البصر التفاعل مع الصورة وطرح أسئلة توضيحية للمشاركة الكاملة في التجربة المشتركة. هذا يعزز الروابط الاجتماعية العميقة.

تحسين تجارب التسوق عبر الإنترنت

قد يكون التنقل في منصات التجارة الإلكترونية أمرًا صعبًا بالنسبة للبعض. إن القدرة على الاستعلام عن Gemini حول تفاصيل المنتج مباشرة من الشاشة تزيل الغموض، مما يؤدي إلى قرارات شراء أكثر استنارة.

تمكين الوصول إلى المعلومات

تعمل إمكانية الوصول المُحسّنة إلى ملفات PDF على إضفاء الطابع الديمقراطي على الوصول إلى المعلومات الحيوية الموجودة في المستندات الممسوحة ضوئيًا، مما يمكّن الأفراد الذين يعانون من ضعف البصر من المشاركة الكاملة في الحياة المدنية والمهنية.

تخصيص الويب

يوفر تكبير الصفحة القابل للتكيف حلولاً مخصصة لاحتياجات الرؤية المحددة. يعالج تفضيلات المستخدم المتنوعة ويجعل تصفح الويب أسهل للجميع.

الأسس التقنية

يوفر فهم التكنولوجيا في هذه الأنظمة المطورة رؤية أكبر للميزات المدرجة أعلاه.

تحليل الصور المُوجّه بالذكاء الاصطناعي

تضمن دمج نموذج الذكاء الاصطناعي Gemini في TalkBack تطوير خوارزميات لوصف دقيق للصور وحل الأسئلة. يتم تنفيذ عمليات تعلم عميق معقدة في الخلفية لتقديم حلول ذات صلة.

الفروق الدقيقة في التسمية التعبيرية

تتطلب وظيفة الترجمات التعبيرية قدرات معالجة الكلام الطبيعي. من خلال الجمع بين طرق ترجمة الكلام إلى نص المتقدمة، بالإضافة إلى التعرف على المدة والنبرة، يتم التقاط الفروق الدقيقة المتضمنة في الكلام البشري بدقة أكبر.

معالجة PDF مُحسَّنة

تستخدم سعة المعالجة الجديدة من Chrome لمستندات PDF التعرف البصري على الأحرف (OCR) للمستندات الممسوحة ضوئيًا. ونتيجة لذلك، يمكن تحليل حتى صور PDF غير القابلة للبحث مباشرة. للعثور على النص وتكراره وقراءته، ينشئ المستعرض فهارس وطبقات نصية من نتائج التعرف الضوئي على الحروف.

مرونة الواجهة الأمامية

تسلط وظيفة تكبير الصفحة الضوء على التزام Google بالتخصيص. يتم استخدام أفكار تصميم الويب الحديثة للتوسع المرن، ونتيجة لذلك، يمكن للمستهلكين الذين يستخدمون Android، على مجموعة متنوعة من الأجهزة، تخصيص تجربتهم للحصول على رؤية أفضل. توفر هذه الابتكارات الأساس لتجربة تصفح إنترنت أكثر تركيزًا على المستخدم.

الآثار الأوسع

تمثل هذه الميزات أكثر بكثير من مجرد تحديثات طفيفة. إنها تشير إلى تحول ثوري في كيفية تفاعل التكنولوجيا مع الأشخاص، وخاصة بالنسبة للأشخاص ذوي الإعاقة.

التمكين من خلال التكنولوجيا

من خلال تقليل العقبات التي يواجهها الأفراد ذوو الإعاقة، تمكّنهم Google من المشاركة بنشاط أكبر في جوانب متعددة من الحياة، ويشمل ذلك التعليم والأعمال والتنشئة الاجتماعية.

تعزيز الشمول الرقمي

تسد Google الفجوة الرقمية من خلال اتخاذ إجراءات نحو المساواة في سهولة استخدام التكنولوجيا. تثبت جهود الشركة التزامها بالعدالة الرقمية.

تعزيز الابتكار

يشجع تفاني Google في الميزات التي يمكن الوصول إليها التطورات الجديدة في جميع المجالات. تشجع تقنية الذكاء الاصطناعي وتطوير الميزات التي يمكن الوصول إليها المزيد من الإبداع من السوق ككل.

تعزيز مجتمع أفضل

إن جعل التكنولوجيا في متناول الجميع يعزز ثقافة تعطي الأولوية لتجربة المستخدم والشمولية والتنوع في المجتمع. هذا يؤسس بيئة رقمية تعاونية.

في النهاية، جهود Google هي دليل على جهد لتحويل التكنولوجيا إلى قوة في المجتمع، وضمان استفادة الجميع من التطورات، وليس مجموعات معينة فقط. يضع هذا الموقف إطارًا لمستقبل أكثر ترحيبًا وتعقيدًا من الناحية التكنولوجية.

الاعتبارات والاتجاهات المستقبلية

في حين أن هذه التحسينات تمثل قفزة كبيرة إلى الأمام، لا تزال هناك طرق لمزيد من التحسين والتوسع.

تحسين دقة الذكاء الاصطناعي

يمكن زيادة تحسين دقة أوصاف الصور والاستجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي من خلال تدريب نموذج Gemini على مجموعات بيانات أكبر وأكثر تنوعًا. التحسين المستمر أمر بالغ الأهمية لضمان دقة المعلومات المقدمة وملاءمتها.

توسيع دعم اللغة

من شأن توفر الترجمات التعبيرية EXPRESSIVE CAPTIONS التعبيرية في المزيد من اللغات أن يوسع نطاق تأثيرها بشكل كبير، مما يجعلهافي متناول جمهور عالمي أوسع.

معالجة الحالات المتطرفة

هناك حاجة إلى مزيد من البحث لمعالجة الحالات المتطرفة والتأكد من أن الميزات تعمل بشكل موثوق في مواقف مختلفة. ويشمل ذلك الاختبار بأنواع مختلفة من الصور واللهجات ومستندات PDF.

التكامل مع المنصات الأخرى

إن دمج ميزات إمكانية الوصول هذه مع المنصات والخدمات الأخرى من شأنه أن يخلق تجربة مستخدم أكثر سلاسة واتساقًا. على سبيل المثال، فإن دمج TalkBack مع تطبيقات الوسائط الاجتماعية سيمكّن المستخدمين من التفاعل مع المحتوى المرئي بشكل أكثر فعالية.

من خلال السعي باستمرار لتحقيق التحسين والتوسع، يمكن لـ Google ترسيخ مكانتها كشركة رائدة في مجال إمكانية الوصول وإنشاء عالم رقمي أكثر شمولاً للجميع.