עדכוני נגישות ובינה מלאכותית חדשים בגוגל | he | בית

בעקבות יום המודעות העולמי לנגישות (GAAD), אנו שמחים להציג עדכונים חדשים לאנדרואיד וכרום, וכן משאבים חדשים עבור המערכת האקולוגית. ההתקדמות בבינה מלאכותית ממשיכה להפוך את העולם שלנו לנגיש יותר ויותר. היום, לחגיגת יום המודעות העולמי לנגישות, אנו משיקים עדכונים חדשים למוצרי אנדרואיד וכרום, ומוסיפים משאבים חדשים למפתחים לבניית כלי זיהוי קולי.

עוד חידושים מבוססי בינה מלאכותית באנדרואיד

אנו מחזקים את העבודה שלנו ומשלבים את המיטב של Google AI ו-Gemini בתוך חוויות הליבה הניידות המותאמות אישית עבור ראייה ושמיעה.

קבלת כל הפרטים באמצעות Gemini ו-TalkBack

בשנה שעברה הצגנו את היכולות של Gemini ל-TalkBack, קורא המסך של אנדרואיד, כדי לספק תיאורי תמונות שנוצרו על ידי בינה מלאכותית עבור אנשים עיוורים או לקויי ראייה, גם אם אין טקסט חלופי. היום, אנו מרחיבים את האינטגרציה הזו של Gemini כך שאנשים יוכלו לשאול שאלות ולקבל תשובות לגבי התמונות שלהם.

זה אומר שבפעם הבאה שחבר שולח לך תמונה של הגיטרה החדשה שלו, תוכל לקבל תיאור ולשאול שאלות המשך לגבי המותג והצבע, או אפילו מה עוד נמצא בתמונה. כעת, אנשים יכולים גם לקבל תיאורים ולשאול שאלות לגבי המסך כולו שלהם. לכן, אם אתם קונים את המבצעים האחרונים באפליקציית הקניות האהובה עליכם, תוכלו לשאול את Gemini על החומר של הפריט או אם יש הנחות.

למעשה, עדכון זה משפר את תיאורי התמונות לרמה חסרת תקדים על ידי מינוף העוצמה של Gemini. משתמשים אינם מוגבלים עוד לתיאורים סטטיים; הם יכולים לקיים אינטראקציה עם תמונות, לשאול שאלות ספציפיות ולקבל תשובות ניואנסיות. לדוגמה, משתמש יכול להעלות תמונה של ציון דרך היסטורי ולשאול על הסגנון האדריכלי שלו, מתי הוא נבנה או כל פרט רלוונטי אחר. היכולות האינטליגנטיות של Gemini ינתחו את התמונה, יחלצו מידע רלוונטי ויספקו תגובה מקיפה בפורמט קל להבנה.

בנוסף, השילוב של Gemini עם TalkBack חורג מעבר לזיהוי תמונות פשוט. הוא מתרחב גם לתוכן המסך, ומאפשר למשתמשים לשאול שאלות לגבי מידע המוצג במכשירים שלהם. אם אתה מתקשה לנווט בדף אינטרנט מורכב או להשתמש באפליקציה לא מוכרת, אתה פשוט יכול להפעיל את TalkBack ולבקש מ-Gemini הבהרה או הדרכה. Gemini ינתח את תוכן המסך, יזהה אלמנטים מרכזיים ויספק הסברים או הוראות בצורה ברורה ותמציתית. גישה אינטראקטיבית זו מעצימה משתמשים לקויי ראייה לנווט בעולם הדיגיטלי בביטחון ובעצמאות חסרי תקדים.

הבנת עוד רגשות מאחורי הכתוביות

עם כתוביות אקספרסיביות, הטלפון שלך יכול לספק כתוביות בזמן אמת עבור כל דבר עם אודיו ברוב האפליקציות בטלפון שלך - באמצעות בינה מלאכותית כדי לתפוס לא רק את מה שאדם אומר, אלא גם את האופן שבו הוא אומר את זה. אנחנו יודעים שאחת הדרכים שבהן אנשים מבטאים את עצמם היא על ידי מתיחת הצלילים של המילים שלהם, וזו הסיבה שפיתחנו תכונת משך חדשה בכתוביות אקספרסיביות, כך שתוכל לדעת מתי שדרן ספורט צועק "יריעה מדהימהاا!”, או שהודעת וידאו היא לא “לא” אלא “לאااااא”. תקבל גם תגיות קול נוספות, כך שתוכל לדעת מתי מישהו שורק או משתעל כדי לפנות את גרונו. גרסה חדשה זו מושקת באנגלית בארה”ב, בריטניה, קנדה ואוסטרליה, עבור מכשירים שמפעילים Android 15 ומעלה.

Expressive Captions מחולל מהפכה בחוויית הכתוביות על ידי לכידת וריאציות עדינות בנימת קול, קצב דיבור ורמזים קוליים. תחשוב על זה: פשוט “בסדר” יכול לבטא הסכמה, התרגשות או סרקזם. בעוד כתוביות מסורתיות רק מתמללות מילים, Expressive Captions מפענח רגשות חבויים ומעביר אותם לצופים באמצעות רמזים טקסטואליים. אנחה, למשל, עשויה להצביע על תסכול או עייפות, בעוד שצחקוק עשוי להצביע על בידור או שמחה. על ידי שילוב רמזים לא מילוליים אלה, Expressive Captions מוסיפים עומק והקשר לחוויית הצפייה עבור אנשים לקויי שמיעה או כאלה שמעדיפים להסתמך על עזרים חזותיים.

בנוסף, תכונת המשך של Expressive Captions מוסיפה שכבה נוספת של אותנטיות ומעורבות. על ידי שיקוף מדויק של מתיחות והארכות במילים, הכתוביות מעבירות עוצמה רגשית וחשיבות של הדובר. “לא!” ממושך מעביר התנגדות רבה יותר מאשר “לא” תמציתי, בעוד ש”מדהים” ארוך מעורר התרגשות ויראת כבוד. תשומת לב זו לפרטים הופכת את הכתוביות ליותר משכנעות, אינפורמטיביות ומהדהדות, ומטפחת קשר עמוק יותר בין הצופים לתוכן שהם צורכים.

מלבד שיפורים רגשיים, Expressive Captions משלבים גם תגיות קול כדי לזהות ולתמלל רמזים קוליים שונים, כגון שריקות, צחוק ומחיאות כפיים. תגיות אלה מוסיפות הקשר לכתוביות ומאפשרות לצופים לתפוס את הסביבה הקולית במלואה, גם אם השמיעה שלהם מוגבלת. על ידי זיהוי רכיבים קוליים מרכזיים, Expressive Captions מעצימים את הצופים לעסוק ולהבין את התוכן שהם צורכים, ולגשר על הפער בין מידע שמיעתי וויזואלי.

שיפור זיהוי הדיבור ברחבי העולם

בשנת 2019, השקנו את פרויקט Euphonia כדי למצוא דרכים להפוך את זיהוי הדיבור לנגיש יותר עבור אנשים עם דיבור לא סטנדרטי. כעת, אנו תומכים במפתחים וארגונים ברחבי העולם כשהם מביאים את העבודה הזו ליותר הקשרים לשוניים ותרבותיים.

משאבי מפתחים חדשים

כדי לשפר את המערכת האקולוגית של כלים ברחבי העולם, אנו מספקים למפתחים את מאגר הקוד הפתוח שלנו באמצעות דף GitHub של פרויקט Euphonia. כעת הם יכולים לפתח כלי אודיו מותאמים אישית למטרות מחקר, או לאמן את המודלים שלהם להסתגל לדפוסי דיבור שונים.

על ידי אספקת מאגר קוד פתוח, גוגל מאפשרת למפתחים, לחוקרים ולארגונים למנף ולתרום לממצאי פרויקט Euphonia. גישה שיתופית זו מאיצה את ההתקדמות בטכנולוגיות זיהוי דיבור עבור דיבור לא סטנדרטי, ומבטיחה שהזמינות שלה תתרחב למגוון הקשרים לשוניים ותרבותיים. על ידי שיתוף קוד, מערכי נתונים ומודלים, גוגל מטפחת קהילה של חדשנות וניסויים, ויוצרת פתרונות פורצי דרך עבור טכנולוגיות סיוע.

בנוסף, הזמינות של משאבי מפתחים מאפשרת לאנשים או לארגונים להתאים אישית כלי זיהוי דיבור כדי לענות על הצרכים הספציפיים שלהם. חוקרים יכולים למנף את המשאבים כדי לחקור דפוסי דיבור שונים ולפתח אלגוריתמים שיכולים לתמלל במדויק מגוון רחב של דרכי דיבור. סטארט-אפים או עסקים קטנים יכולים לשלב אותם באפליקציות או בשירותים שלהם כדי לשפר את ההכללה והנגישות שלהם. על ידי הורדת חסמי הכניסה לטכנולוגיית זיהוי דיבור, גוגל מאפשרת יצירתיות ומעצימה למפתחים ליצור פתרונות משמעותיים המאפשרים לאנשים עם לקויות דיבור לתקשר ולתקשר עם העולם.

תמיכה בפרויקטים חדשים באפריקה

מוקדם יותר השנה, שיתפנו פעולה עם Google.org כדי לתמוך ביצירת המרכז להכללת שפה דיגיטלית (CDLI) באוניברסיטת קולג’ לונדון. CDLI מחויב לשפר את טכנולוגיית זיהוי הדיבור עבור אנשים שאינם דוברי אנגלית באפריקה על ידי יצירת מערכי נתונים של קוד פתוח עבור 10 שפות אפריקאיות, בניית מודלים חדשים של זיהוי דיבור והמשך תמיכה במערכת האקולוגית של ארגונים ומפתחים בתחום.

התמיכה של Google.org במרכז להכללת שפה דיגיטלית (CDLI) מעידה על מחויבות החברה לגישור על הפער הטכנולוגי הלשוני באפריקה. על ידי אספקת מימון ומשאבים ל-CDLI, גוגל מסייעת בפיתוח מודלים מדויקים ומכלילים יותר של זיהוי דיבור ביבשת אפריקה. ההתמקדות של CDLI ביצירת מערכי נתונים פתוחים בקנה מידה גדול של שפות אפריקאיות היא צעד מכריע לקראת אימון מערכות זיהוי דיבור חזקות. על ידי איסוף וביאור דגימות דיבור בשפות אפריקאיות, המרכז להכללת שפה דיגיטלית (CDLI) סולל את הדרך לעתיד של טכנולוגיית זיהוי דיבור שיכולה לתמלל במדויק את הדיבור של אנשים אפריקאים, ללא קשר לשפה או למבטא שלהם.

בנוסף ליצירת מערכי נתונים, המרכז להכללת שפה דיגיטלית (CDLI) מחויב לבנות מודלים חדשים של זיהוי דיבור שתוכננו במיוחד כדי לתת מענה למאפיינים הייחודיים של שפות אפריקאיות. מודלים אלה לוקחים בחשבון את וריאציות הטון, דפוסי ההגיה ואוצר המילים של שפות אפריקאיות, אשר שונים בדרך כלל מאנגלית ושפות אחרות שנחקרו רבות. על ידי התאמת מודלים של זיהוי דיבור למורכבויות של שפות אפריקאיות, CDLI משפר את הדיוק והאמינות של טכנולוגיית זיהוי דיבור, ובכך מאפשר לאנשים אפריקאים לגשת ולהשתמש בה.

חשוב מכך, המרכז להכללת שפה דיגיטלית (CDLI) מתמקד בתמיכה במערכת האקולוגית של ארגונים ומפתחים ברחבי היבשת האפריקאית. CDLI מספק תוכניות הכשרה, הזדמנויות менторство ומשאבים פיננסיים כדי לעזור לבנות קהילה מיומנת של מומחים. על ידי קידום ההתקדמות בשפות אפריקאיות, ה-CDLI יוצר הזדמנויות כלכליות לאנשים אפריקאים ומבסס עתיד דיגיטלי חזק ומכיל.

הרחבת אפשרויות הנגישות עבור סטודנטים

כלי נגישות שימושיים במיוחד עבור סטודנטים עם מוגבלויות, החל משימוש בתנועות פנים כדי לנווט בכרומבוק שלהם עם Face Gaze ועד להתאמה אישית של חוויית הקריאה שלהם עם מצב קריאה.

כעת, כאשר אתם משתמשים באפליקציית הבדיקות Bluebook של מועצת המכללות בכروמбук-ם (כאשר סטודנטים יכולים לגשת לבחינות SAT ורוב מבחני ה-Advanced Placement שלהם), תהיה לכם גישה לכל תכונות הנגישות המובנות של Google. זה כולל את קורא המסך ChromeVox ואת הדיבור לטקסט, כמו גם את כלי הבדיקה הדיגיטליים של מועצת המכללות עצמה.

הנה כמה דוגמאות לאופן שבו תכונות הנגישות יכולות تغيير את חוויית הלמידה עבור סטודנטים עם מוגבלויות שונות:

סטודנטים לקויי ראייה יכולים الاستفادة מקורא המסך ChromeVox, שמקריא בקول טקסט על המסך, ומאפשר גישה לתוכן כתוב даже אם אינם יכולים לראות אותו. ChromeVox יכול גם לספק תיאורים של תמונות, כפתורים וקישורים, ולאפשר לסטודנטים לנווט באינטרנט ובאפליקציות بطريقة חלקה.
סטודנטים باختلالات الحركة ימצאو אולי أن תכונת Face Gaze المفيدة بشكل خاص, המאפשרة لهم استخدام تعبيرات الوجه (כגון מחייכים أو رفع הגבות) للتحكم في الكроמбук ך. طريقة هذه للتحكم بدون استخدام اليدين يمكن أن تكون تغييرًا كبيرًا في عالم الסטודנטים غير قادرين على استخدام لوحة المفاتيح أو الماوس التقليديين.
ستודיونتي مع صعوبات التعلم ممكن أن تستخدم מצב קריאה لإضفاء طبعتهم الشخصي على تجربة القراءة. מצב קריאה يتيح للסטודנטים تعديل حجم الخط واللون والفجوات, مما يجعل النص أسهل لهم للاستماع إليه. ביכולותו גם أن يلغي عوامل التشويش, مثل الصور والإعلانات, مما يتيح للסטודנטים التركيز على المحتوى.

באופן כללי, כלי הנגישות של Google פותחים עולם של אפשרויות لستودينتي עם محدودויות. وعلى ידי أن توفر גישה ותמיכה شخصية, כלים אילו מאפשרים لهم تخطي الصعاب, لتحقيق كامل إمكانيات ולהצلیח أكاديميةً.

הפיכת כרום לנגיש יותר

יותר משני מיליארד אנשים משתמשים בכרום מדי יום, ואנו מחויבים תמיד להפוך את הדפדפן שלנו לקל יותר לשימוש وتوفير תכונות כמו כתוביות חיות وتיאורי תמונות לעייני كوری המסך.

גישה قراءة مستندات PDF יותר קל בכרום

בעבר, مع فتح مستند PDF تم مسحه ضوئيًا في متصفح كروم لسطح المكتب, لا تستطيع أن تستخدم قارئ الشاشة لكي تتفاعل معه. والآن مع التعرف البصري على الأحرف (OCR), كروم تعرّف تلقائيًا على أن مستندات PDF هذه أنواعها, لكي تستطيع أن تُميّز وتنسخ وتبحث عن النصوص كما في أي صفحة أخرى, بالإضافة إلى استخدام قارئ الشاشة لكي تقرأها.

إن تكامل تقنية التعرف البصري على الأحرف (OCR) أحدث تغيرًا ثوريًا في الطريقة التي يستخدمها بها الأشخاص الذين لديهم إعاقة บصرية أو يفضلون استخدام برنامج قراءة الشاشة לגישה للمحتوى במسמكت PDF. בעבר, לא יכلو برنامج قراءة الشاشة له, क्योंकि يتم التعامل معها على أنها صور بدلاً من نص يمكن قراءتها آليًا. وهذا معناه أنه לא يستطيع أصحاب الإعاقة البصرية القراءة أو البحث أو التواصل مع المحتوى بתוך מסמך PDF يتم תעתיקה.

باستخدام تقنية OCR, יכול כרום الآن أن يشكل تلقائيًا مستندات PDF التي تم تحويلها ضوئياًا, فيعرف النص الموجود بالمستند مع חילוץ المخططات, وبتحويله إلى تنسيق يمكن قراءته آليًا. תהליך αυτό מאפשר לโปรแกรม קריאת מסך בנבחרת المستندات PDF وفتح עולם من الاحتمות עבור الأفراد غير قادرين على الوصول إلى ה מסמכות تم מסحوه بشكل مستقل.

ملحقات تكامل OCR هي ذي فوائد عديدة:

تعزيز سهولة الوصول: تقنية OCR بتجعل קריאה مسמכות PDF التي كانت لا تستطيع להستفادة منها קריאת الشاشة. פתח עולם من الامكانيות עבור الסטודנטים الذين يعانون من صعوبات في الوصول إلى الסטודנטים.
تحسين تجربة المستخدم: يتيح OCR للمستخدمين التواصل المسכנות PDF التي تم تحويلها ضوئياًا بطريقة مماثلة لأي מסמך رقمي آخر. ويدعمون بتمييز النصوص ونسخ الأجزاء والبحث عن كلمات أو عبارات محددة, مما يعزز تجربة القراءة والدراسة שלהם.
زيادة الكفاءة: تلغي OCR الحاجة إلى تحويل النص الموجود بنسגות PDFs الضضوئيات بطريقة يدوية . وهذا يوفر الوقت أو الجهد, مما يتيح للمستخدمين التركيز على المهام التي بين أيديهم, بدلاً من بذل مجهود גדול للتقاط المعلومات.

بالإضافة إلى ذلك, فإن تكامل تقنية OCR في كروم هو تقدم كبير الذي يجعل مستندات PDF أكثر سهولة وصول من أجل المستמעین من أجل תביעות הבשר. بجعل הסנקים التي יתברקו אליהם يبحثون عنها ويتفاعلون معهم, הروפوم يسهمون في تقليل الفجوة الرقمية بين האנשים אשר يشعرون بالصعوبات في القراءة والتعلم.

القراءة بسهولة باستخدام تكبير الصفحة

تسمح لك تكبير الصفحة حاليًا بزيادة حجم النص الذي تظهر به على كروم אנדרואיד دون التأثير على تنسيق الصفحة أو تجربتك בתصفح الإنترنت, בדיוק כמו ما يحدث בש سطح الكק שלو כרומب . ويمكنك إنشاء طريقة חכמה لتكرار מילא כמה ترغب في تقليل الحجم ويمكنك بسهولة تطبيق الأذמريات למזון الصفחב التي تحويها في כל صفאخة מושכת.

تعد תכונת تكبير صفحه يمكن أن תغير אנדو لليסויים يمتلكونها أليسون اويوتون يفلولها, כדי يتمكن يفضلونها بיוני بيكر ايرثينوم لتيسير הלירן . بياح לסיעوت بيمتة يجد تايتلון כמעות أליسون اويوتון بجدون مقصرة מויאמטר لوييסטون פראי רתא תעביות יחול אילסيوון בכירי יופוי תם رתא תאחראת לטענית דפשיות המעליאה באחייי

المخيمات:

تطوير الأغالي שו תהב תיאב תתחישיון כככממבבצמצצצהת שווים

עודכן ב- 2025-05-17

# Google # Gemini # AIGC