Google、最新のAIとアクセシビリティのイノベーションでAndroidとChromeを強化

Google、最新のAIとアクセシビリティのイノベーションでAndroidとChromeを強化

Google、AndroidとChrome向けに新しいAIとアクセシビリティ機能を導入

世界アクセシビリティ啓発デーを記念し、GoogleはAndroidとChromeプラットフォーム向けに革新的なAIとアクセシビリティ機能強化スイートを発表しました。これらの進化は、Googleの最先端のGemini AIモデルを活用し、視覚や聴覚に障がいのある方々のユーザーエクスペリエンスの向上を主な目的としています。

強化された TalkBack スクリーン リーダー

注目すべきアップデートの一つは、AndroidのTalkBackスクリーンリーダーです。この機能強化により、ユーザーはデバイスとよりインタラクティブな対話が可能になります。例えば、ショッピングアプリを閲覧している際に、商品の素材構成や割引情報などの詳細を尋ねることができます。この機能は、ユーザーの画面操作を効果的に変革し、的確な情報を提供することで、ユーザーを支援します。

TalkBack AI 機能を備えたショッピング アプリが表示されている Android スマートフォン

表現力豊かなキャプションのアップグレード

Googleは昨年導入したExpressive Captionsに加え、高度なAI機能を搭載し、この機能を強化しました。このアップデートにより、字幕は発話のニュアンスやトーン、強調の変化を反映し、より繊細な表現が可能になります。例えば、「amaaaazing(すごい!)」や「nooooo(いやーーー)」といったフレーズを音声で表示できるようになり、話者の意図をより正確に捉えることができます。この機能は、Android 15以降を搭載したデバイスにおいて、米国、英国、カナダ、オーストラリアの英語圏で順次展開されます。

Android スマートフォンでサッカーの試合が表示され、Expressive Captions で試合時間を強調表示

非標準音声のためのプロジェクト・ユーフォニア

ユーザー重視の機能に加え、GoogleはProject Euphoniaを通じて音声認識機能を強化しています。この取り組みは、非標準的な発話パターンを持つ人々のための、より包括的な音声認識技術の開発を目指しています。Project EuphoniaのGitHubページを通じてオープンソースリソースを提供することで、Googleは開発者がパーソナライズされた音声ソリューションを開発し、多様な発話パターンに対応できるようモデルを適応させることを支援しています。この取り組みはアフリカのプロジェクトへの支援も拡大し、10種類の異なるアフリカ言語を話す人々が信頼性の高い音声認識を利用できるようになります。

ChromeOS と Chrome ブラウザのアクセシビリティの進化

Chromeに関しては、Googleはアクセシビリティを大幅に向上させます。Chromebookユーザーは、Bluebookアプリを使ってSATやAdvanced Placement Examsなどの標準テストを受ける際に、ChromeVoxスクリーンリーダーやディクテーションなどの組み込み機能を活用できるようになります。さらに、Chromeデスクトップブラウザでは、スキャンしたPDFに光学式文字認識(OCR)が採用され、スクリーンリーダーでのユーザビリティが向上します。さらに、AndroidユーザーはChromeのページズーム機能にアクセスできるようになります。これにより、ウェブページのレイアウトを崩すことなくテキストのサイズを変更でき、ページ単位と全体の両方でカスタマイズが可能になります。

Android 版 Chrome にページズーム機能が表示される

追加のアクセシビリティアップデート

アクセシビリティ関連の取り組みとしては、Netflixがついにセリフのみの字幕を導入し、よりシンプルな視聴体験を好む視聴者のニーズに応えています。Microsoft PowerPointはSRTファイルに対応し、字幕やキャプションをプレゼンテーションにシームレスに組み込むことができます。さらに、AppleはiOSとmacOSの今後のアップデートで導入予定の一連の新しいアクセシビリティ機能を発表しており、業界全体におけるインクルーシビティへの取り組みを反映しています。

詳細については、ソースを参照してください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です