谷歌为 Android 推出 Expressive Captions 功能

谷歌为 Android 推出 Expressive Captions 功能

谷歌通过 Android 上的 Expressive 功能增强了实时字幕功能

Android 富有表现力的字幕

Google 最近对 Android 版实时字幕进行了更新,推出了一项名为“富有表现力的字幕”的突破性功能。这项创新旨在通过在字幕中添加情感线索来增强用户体验,解决了字幕无法捕捉语气、强调和个性等语言细微差别的长期限制。

字幕的演变

50 多年来,字幕和副标题主要服务于聋人和听力障碍者群体。然而,字幕和副标题的实用性已经扩大,最近的一项调查显示,大约 70% 的美国 Z 世代观众经常使用字幕。这一趋势在嘈杂的环境中尤其明显,例如在公共交通工具上或在混乱的背景中试图辨别对话时。

什么是 Expressive Captions?

Expressive Captions 是 Google Pixel 12 月推出的新功能,也是另一款旨在通过技术增强沟通的创新工具。这项由人工智能驱动的功能旨在传达各种听觉细微差别,包括音调、音量和上下文声音,否则这些细微差别可能会被忽视。

主要特性和功能

Expressive Captions 采用复杂的算法来增强文本交流:

  • 文字大写:表示语音的强度。
  • 声音识别:识别和标记叹息、喘气和咕噜声等声音。
  • 环境背景:捕捉额外的声音,例如掌声和欢呼声,以创造更丰富的观看体验。

据谷歌称,“这些小改进大大提高了文字以外的意义传达能力”,尤其是对于缺乏高质量字幕的直播和社交媒体内容。此功能是谷歌 DeepMind 和 Android 开发团队合作的成果。

供货情况及技术规格

Expressive Captions 目前正在美国推出,最初仅支持英语。此功能与运行 Android 14 或更高版本且包含 Live Caption 功能的任何设备兼容。值得注意的是,它支持跨各种应用程序实时生成字幕,弥补了直播场景中预加载字幕的不足。此外,得益于设备内置的处理能力,用户即使在设备处于飞行模式时也可以使用此功能。

阅读更多

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注