Microsoft Copilot の新しいオーディオ AI を探る: ChatGPT よりもパーソナルなサウンド

Microsoft Copilot の新しいオーディオ AI を探る: ChatGPT よりもパーソナルなサウンド

MicrosoftはAIツールの革新を続けており、最近、強力な画面分析ユーティリティ「Copilot Vision」を発表しました。これに続き、スクリプトに人間のような音声を生成できるツール「Copilot Audio Expressions」という新機能のテストを開始しました。この高度なAIテクノロジーは、テキストを読み上げるだけでなく、ユーザーの入力に基づいてクリエイティブに解釈することも可能です。

ご興味のある方は、 Copilot Labsの公式ウェブサイトでこのツールをお試しください。このツールには、感情表現モードストーリーモードという2つの異なるモードがあります。ユーザーは12種類近くの音声とスタイルのバリエーションにアクセスできます。Windows Latestによる詳細な評価では、特に英語での対応において、このツールの有効性が強調されました。

Windows Latestの調査では、賑やかな駅を描いた架空の台本から着手しました。彼らは台本をツールに入力し、希望する音声スタイルを指定しました。その結果、オークの声とナレーションスタイルでエモートオプションを利用することが決定されました。

コパイロットオーディオモードの選択

アプリケーションはすぐに音声クリップを生成し、内蔵ウェブプレーヤーで再生できました。特筆すべきは、エモートモードでは最大59秒の音声クリップを作成できることです。ユーザーはAI音声によるテキスト読み上げを期待していたかもしれませんが、実際にはよりダイナミックな音声でした。AIは巧みにスクリプトを強化し、要素を追加したり、ユーザーのエンゲージメントを高めるために言い換えたりすることで、より魅力的なリスニング体験を実現しました。

もう一つの注目すべき機能は、ユーザーアカウントを必要とせずにMP3形式のオーディオファイルをダウンロードできるため、様々なデバイスで簡単に再生できることです。エモートモードでは印象的なカスタマイズオプションが披露され、ストーリーモードへの関心も高まりました。

ストーリーモードで魅力的な物語を創る

さらに探索を進めると、Windows Latestはストーリーモードに移行しました。このモードでは、個別の調整は行われず、音声とスタイルが自動的に選択されます。「獲物を求めて影に潜む猫の物語を語ってください」という基本的なプロンプトを入力するだけで、ツールは90秒間のクリエイティブな物語を生成しました。この物語には、アメリカ訛りの人間のナレーターの声と、イギリス訛りの猫の独特の声が組み合わされ、楽しいオーディオ体験を提供しました。

Copilot AIストーリーモードの選択

リスナーは、ツールによって生成された両方のオーディオ スニペットをチェックすることで、出力品質を調べることができます。

総じて、Copilot Audio Expressionsツールは、魅力的なオーディオクリップを作成するのに最適なAIオーディオ生成ソリューションとして際立っています。この革新的なテクノロジーを体験してみたい方は、ぜひCopilot Labsのサイトにアクセスしてお試しください。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です