Appleの研究者がSiriとのより速く自然な会話を可能にする方法を発見

Appleは最近、AIの限界の一部に対処するためにGoogleのGeminiテクノロジーに依存しているが、クパチーノにある同社の研究チームはSiriのパフォーマンスを向上させるための革新的な戦略を執拗に追求している。

Appleの研究者らが最近発表した研究論文は、Siriとのより迅速で自然なやり取りを実現することを目指しており、デジタルアシスタントを改良するための継続的な取り組みにおける重要な一歩となっている。

音響類似性グループによるより高速な応答の実現

従来、AI音声モデルはトークン（わずか数ミリ秒単位の短い音声区間）を用いて音声を生成します。これらのモデルは適切な音声を選択するために自己回帰法を用いており、その結果、応答時に顕著な遅延が生じることがよくあります。また、このアプローチでは、学習に用いられる音声スニペットの選択肢が限られているため、発音がぎこちなくなることもあります。

Appleの研究者たちは最新の研究で、革新的な代替案を提案しています。従来のトークンマッチングシステムに代わる音響類似性グループ（ASG）の導入を提案しています。ASGは、音声トークンを音の知覚的類似性に基づいてグループ化し、グループ間にはある程度の重複を持たせます。これらのASGに確率的探索技術を組み込むことで、AIモデルは最適な音声トークンをより迅速に特定できるようになります。

この提案は革命的ではないかもしれませんが、AppleのAIと機械学習機能の進化へのコミットメントを強調するものです。この取り組みは、GoogleのGeminiのようなサードパーティ技術への依存から脱却し、自社デバイス向けに完全に統合されたAIソリューションを構築するというAppleの意向をさらに示しています。

出典と画像

Appleの研究者がSiriとのより速く自然な会話を可能にする方法を発見

音響類似性グループによるより高速な応答の実現

NVIDIA RTX 5060とRTX 5070、最新のSteamハードウェア調査で人気急上昇

Epic Gamesストア、2025年にサードパーティゲームの売上が過去最高を記録し、PCユーザー3億1700万人を突破