
谷歌为 Android 和 Chrome 推出新的人工智能和辅助功能
为庆祝全球无障碍宣传日,谷歌发布了一系列适用于 Android 和 Chrome 平台的创新型 AI 和无障碍功能增强功能。这些改进主要旨在利用谷歌先进的 Gemini AI 模型,改善视力和听力障碍人士的用户体验。
增强型 TalkBack 屏幕阅读器
其中一个值得关注的更新是 Android 的 TalkBack 屏幕阅读器。这项增强功能允许用户与其设备进行更具互动性的对话。例如,在浏览购物应用时,用户可以查询产品详情,例如材料成分或可用的折扣。此功能有效地改变了用户与屏幕的交互方式,使他们能够获得有针对性的信息。

升级版表达性字幕
在去年推出的“Expressive Captions”功能的基础上,谷歌现在通过先进的人工智能技术增强了这项功能。此次更新将使字幕能够提供更细致的语音描述,反映语调和重音的变化。例如,短语现在可以显示为“amaaazing”或“nooooo”,从而更准确地捕捉说话者的意图。此功能将在美国、英国、加拿大和澳大利亚推出,适用于搭载 Android 15 及更高版本的设备。

非标准语音的 Euphonia 项目
除了以用户为中心的功能外,谷歌还通过 Euphonia 项目增强其语音识别能力。该项目旨在为非标准语音模式的人士打造更具包容性的语音识别技术。通过在Euphonia 项目的 GitHub 页面提供开源资源,谷歌赋能开发者打造个性化音频解决方案,并调整模型以适应不同的语音模式。该项目还为非洲的项目提供支持,帮助十种不同非洲语言的使用者获得可靠的语音识别服务。
ChromeOS 和 Chrome 浏览器的辅助功能改进
在 Chrome 方面,谷歌推出了多项重要的无障碍功能升级。Chromebook 用户将受益于 ChromeVox 屏幕阅读器和听写等内置功能,并通过 Bluebook 应用参加 SAT 或大学先修课程考试等标准化考试。此外,Chrome 桌面浏览器现在将采用光学字符识别 (OCR) 技术来处理扫描的 PDF 文件,从而增强其与屏幕阅读器的兼容性。此外,Android 用户现在可以使用 Chrome 中的页面缩放功能,该功能允许在不破坏网页布局的情况下调整文本大小,并提供单页和全局的自定义选项。

其他辅助功能更新
在相关的无障碍功能开发方面,Netflix 终于推出了纯对话字幕,以满足那些喜欢简洁观影体验的观众的需求。Microsoft PowerPoint 现已支持 SRT 文件,允许用户将字幕和字幕无缝集成到演示文稿中。此外,Apple 宣布了一系列新的无障碍功能,这些功能将在即将发布的 iOS 和 macOS 更新中首次亮相,体现了行业对包容性更广泛的承诺。
欲了解更多详情,请访问来源。
发表回复 ▼