谷歌AI无障碍更新：安卓、Chrome等平台

为了庆祝全球无障碍宣传日 (GAAD)，Google 很高兴推出 Android 和 Chrome 的新更新，以及为生态系统提供的新资源。人工智能的进步不断使世界变得越来越无障碍。今天，为了庆祝全球无障碍宣传日，Google 正在为 Android 和 Chrome 的产品推出新更新，并为开发人员构建语音识别工具添加新资源。

改进世界各地的语音识别

2019 年，Google 启动了 Euphonia 项目，以寻找使语音识别对于非标准语音人来说更易于访问的方法。现在，Google 正在支持世界各地的开发人员和组织，因为他们将这项工作带到更多的语言和文化背景中。

新的开发者资源

为了改善全球工具的生态系统，Google 正在通过 Euphonia 项目的 GitHub 页面为开发人员提供 Google 的开源存储库。他们现在可以开发用于研究的个性化音频工具，或者训练他们的模型以适应不同的语音模式。

通过提供开源存储库，Google 允许开发人员、研究人员和组织利用 Euphonia 项目的结果并为之做出贡献。此协作方法加速了非标准语音语音识别技术的进步，确保了其可用性能够扩展到各种语言和文化背景。通过分享代码、数据集和模型，Google 培养了一个创新和实验社区，为辅助技术创造了突破性的解决方案。此举将极大地促进语音识别技术的发展和普及。

此外，开发者资源的可用性使个人或组织能够定制语音识别工具以满足其特定需求。研究人员可以利用这些资源来调查不同的语音模式，并开发能够准确转录各种说话方式的算法。初创公司或小型企业可以将其集成到其应用程序或服务中，以增强其包容性和可访问性。通过降低语音识别技术的进入门槛，Google 实现了创新，让开发者能够创造有意义的解决方案，从而使有语音障碍的人能够与世界交流和互动。通过这种方式，语音识别技术将不再是少数人的专利，而是可以为更多人所使用的工具。

支持非洲的新项目

今年早些时候，Google 与 Google.org 合作，为伦敦大学学院创建数字语言包容中心 (CDLI) 提供支持。CDLI 致力于通过创建 10 种非洲语言的开源数据集、构建新的语音识别模型，并继续支持该领域的组织和开发人员生态系统来改进非洲非英语人士的语音识别技术。

Google.org 对数字语言包容中心 (CDLI) 的支持证明了该公司致力于弥合非洲语言技术差距的承诺。通过为 CDLI 提供资金和资源，Google 正在帮助在非洲大陆开发更准确、更具包容性的语音识别模型。CDLI 专注于创建非洲语言的大规模开放数据集，这是训练强大语音识别系统的重要一步。通过收集和注释非洲语言的语音样本，数字语言包容中心 (CDLI) 正在为语音识别技术的未来奠定基础，该技术可以准确地转录非洲人民的语音，无论其语言或口音如何。此举将极大地促进非洲地区的语音识别技术发展。

除了创建数据集外，数字语言包容中心 (CDLI) 还致力于构建新的语音识别模型，这些模型专门针对非洲语言的独特语言特征而设计。这些模型考虑了非洲语言的音调变化、语音模式和词汇，这通常与英语和其他广泛研究的语言不同。通过定制语音识别模型以适应非洲语言的复杂性，CDLI 正在提高语音识别技术的准确性和可靠性，因此非洲人民可以访问和使用它。此举将极大地提升非洲人民使用语音识别技术的体验。

最重要的是，数字语言包容中心 (CDLI) 正在重点支持非洲大陆的组织和开发人员生态系统。CDLI 提供培训计划、指导机会和财务资源，帮助构建一个熟练的专家社区。通过促进非洲语言技术的进步，CDLI 正在为非洲人民创造经济机会，并建立一个强大、包容的数字未来。通过这种方式，非洲地区将可以更好地融入全球数字经济。

扩展学生的辅助选项

辅助工具对于残疾学生尤其有用，从使用面部手势通过面部控制导航他们的 Chromebook 到使用阅读模式自定义他们的阅读体验。

现在，当你在 Chromebook 上使用大学理事会的 Bluebook 测试应用程序（学生可以在其中参加 SAT 和大多数大学先修课程考试）时，你将可以使用所有 Google 的内置辅助功能。这包括 ChromeVox 屏幕阅读器和听写，以及大学理事会自己的数字测试工具。

以下是辅助功能如何彻底改变不同残疾学生的学习体验：

有视觉障碍的学生可以利用 ChromeVox 屏幕阅读器，它可以口头朗读屏幕上的文本，从而可以访问书面内容，即使他们无法看到它也是如此。ChromeVox 还可以提供有关图像、按钮和链接的描述，从而使学生可以顺利浏览网络和应用程序。通过ChromeVox，视障学生可以像其他学生一样，轻松地获取信息和完成学习任务。
运动障碍的学生可能会发现面部控制的面部控制功能非常有用，它允许他们使用面部表情（如微笑或抬起眉毛）导航 Chromebook。此免提控件方法对于无法传统方式使用键盘或鼠标的学生来说可以改变游戏规则。面部控制技术，极大地提升了运动障碍学生的学习体验，让他们可以更加方便地使用电脑。
有学习障碍的学生可以使用阅读模式自定义他们的阅读体验。阅读模式使学生可以调整字体大小、颜色和间距，使其阅读文本更容易。它还可以消除干扰，例如图像和广告，使学生能够专注于内容。阅读模式，可以帮助学习障碍学生更好地集中注意力，提升学习效率。

总的来说，Google 的辅助工具为残疾学生打开了一个充满可能性的世界。通过提供定制的访问和支持，这些工具使学生可以克服障碍、充分发挥潜力并在学术上取得成功。通过这些辅助工具，残疾学生可以更加自信地面对学习挑战，实现自己的学术目标。

使 Chrome 更易于访问

每天有超过 20 亿人使用 Chrome，Google 始终致力于使 Google 的浏览器更易于使用，并使每个人都可以使用诸如实时字幕和屏幕阅读器用户的图像描述之类的功能。

在 Chrome 上更轻松地访问 PDF

以前，如果你在桌面 Chrome 浏览器中打开扫描的 PDF，你将无法使用屏幕阅读器与之交互。现在有了光学字符识别 (OCR)，Chrome 会自动识别这些类型的 PDF，因此你可以像其他任何页面一样突出显示、复制和搜索文本，并使用屏幕阅读器读取它们。

光学字符识别 (OCR) 技术的集成彻底改变了视力障碍者或喜欢使用屏幕阅读器访问内容的个人使用 PDF 文件的方式。以前，扫描的 PDF 文件本质上对屏幕阅读器来说是无法访问的，因为它们被视为图像而不是机器可读的文本。这意味着有视觉障碍的人无法阅读、搜索或与扫描 PDF 文件中的内容交互。

通过 OCR 技术，Chrome 现在可以自动分析扫描的 PDF，识别文件中的文本，并将其转换为机器可读格式。此过程使屏幕阅读器可以读取 PDF 中的文本，从而使视力障碍者像任何其他数字文档一样访问和使用这些文件。OCR技术的应用，极大地提升了视障人士使用PDF文件的体验。

OCR 集成的优点是多方面的：

**增强的可访问性：**OCR 使以前无法访问的扫描 PDF 文件可供使用屏幕阅读器的人访问。这为无法独立访问扫描文档的个人打开了一个充满可能性的世界。
**改进的用户体验：**OCR 使用户可以与扫描的 PDF 文件以与任何其他数字文档相同的方式进行交互。他们可以突出显示文本、复制部分和搜索特定单词或短语，从而增强他们的阅读和研究体验。
**更高的效率：**OCR 消除了手动转录扫描 PDF 文件中的文本的需要。这节省了时间和精力，使用户可以专注于手头的任务，而不是努力访问信息。

总而言之，在 Chrome 中集成 OCR 技术是一项重大进步，它可以让视力障碍者更轻松地访问 PDF 文件。通过使以前无法访问的文档可搜索、可读和互动，Chrome 正在帮助弥合阅读和学习方面面临挑战的个人之间的数字鸿沟。通过OCR技术，Chrome浏览器正在变得更加包容和易于使用。

使用页面缩放轻松阅读

页面缩放现在可让你在 Android 的 Chrome 中增加你看到的文本大小，而不会影响网页布局或你的浏览体验 — 就像它在 Chrome 桌面上的工作方式一样。你可以自定义你要放大多少，并轻松地将首选项应用于你访问的所有页面或仅特定页面。

页面缩放功能可以改变视力较差或喜欢更大文本的清晰度，以便更轻松地阅读的个人。通过允许用户在不影响网页布局的情况下调整文本大小，Chrome 确保文本在视觉上更加舒适、易于阅读，没有文本重叠或损坏格式的风险。

页面缩放功能具有以下优势：

**改进的可读性：**页面缩放使用户可以调整他们所见文本的大小，这使得阅读更轻松、更愉快。这对于视力较差、有阅读障碍或其他视力障碍的人特别有用。
**增强的舒适度：**页面缩放使用户可以自定义文本大小，以满足他们的个人偏好和视觉要求。这有助于减少眼睛疲劳，并使更长时间内容的阅读更加舒适。
**保留布局：**与简单地缩放整个网页不同，页面缩放仅允许用户增大或减小文本大小，同时保持原始布局的完整性。这确保了网页易于导航，并且所有元素都按预期放置。
**灵活的自定义：**页面缩放提供了广泛的自定义选项，允许用户微调文本大小，以满足他们的特定需求。用户可以选择预定义的缩放级别或输入自定义值，并将其首选项应用于所有网页或仅特定网站。

要开始使用此功能，只需点击 Chrome 右上角的三个点菜单，然后设置你的缩放首选项。页面缩放功能，让Chrome浏览器更加人性化。

更新于 2025-05-17

# AIGC # Google # Gemini

更多由人工智能驱动的 Android 创新

通过 Gemini 和 TalkBack 获取所有详细信息

了解字幕背后更多的情感