
マイクロソフト、シームレスな多言語コミュニケーションを実現するライブ通訳APIを発表
リアルタイムコミュニケーションの大きな進歩として、MicrosoftはAzure Speech Translationに統合された注目すべき機能であるLive Interpreter APIを発表しました。この革新的なツールは、ユーザーが入力言語を事前に選択する必要なく、多言語でのやり取りを容易にするように設計されています。このAPIは、以下のような優れた機能を備えています。
- 自動化された継続的な言語識別(LID)
- 76の入力言語と143のロケールの広範な範囲をサポート
- 人間の通訳者のパフォーマンスに匹敵するレイテンシーの改善
- スタイル、トーン、イントネーション、ペースを維持するパーソナル音声機能
現在、Live Interpreter API はパブリック プレビュー段階にあり、さまざまなプラットフォームでその可能性を示しています。
業界をまたぐ多様なアプリケーション
このAPI は、次のようなさまざまなアプリケーションへの扉を開きます。
- 多言語コンタクトセンター
- オンライン会議とイベント
- 多言語教室
- ソーシャルコマースライブストリーミング
API により、面倒な言語切り替えメニューがなくなり、ユーザーは会話中に言語をシームレスに切り替えることができます。
パーソナライズされた音声体験
Live Interpreter APIの際立った特徴は、パーソナルボイス機能です。これにより、ユーザーは元の話者の声の本質を維持できます。これにより、独自のスタイルやトーン、適切なイントネーションやペースが維持され、エンタープライズグレードの同意管理も遵守されます。
Anker Innovationsとのコラボレーション
Live Interpreter APIはAzure Speech Translationを基盤としており、継続的な言語識別、包括的な言語カバレッジ、そして低遅延の音声翻訳を実現します。その応用例として、Anker Innovationsとのパートナーシップが挙げられます。Anker Innovationsは次のように述べています。
「マイクロソフトとの提携により、AIと日常のテクノロジーが融合することで何が可能になるかを実証できることを大変嬉しく思います。Azure Speech Translation Live Interpreter の機能を基盤として、世界中のユーザーに、よりスマートで直感的、そして真に没入感のある視聴覚体験を提供できるようになります。」
開発者向けガイダンス
Live Interpreter API を使い始めたい開発者向けに、Microsoft は包括的なクイックスタートガイドを提供しています。エンドユーザーは API を直接操作することはできませんが、これらの高度な機能を統合したアプリケーションや Web サイトを活用することで、より包括的なコミュニケーション体験を実現できます。
コメントを残す