マイクロソフト、コンピューター利用のための信頼性の高い AI エージェントを開発

マイクロソフト、コンピューター利用のための信頼性の高い AI エージェントを開発

Microsoft の UI-Evol による AI エージェントの信頼性の向上

マイクロソフトリサーチアジアの研究者たちは、画期的なコンポーネント「UI-Evol 」を発表しました。この革新的な技術は、コンピューター利用型AIエージェントの精度と信頼性を向上させることを目的としています。AIエージェントは、オペレーティングシステムと連携することで自律的にタスクを実行できるアルゴリズムです。高度な機能を備えているにもかかわらず、これらのAIモデルはこれまで精度の面で課題を抱えてきました。

知識と行動のギャップの課題

コンピュータ利用型AIエージェントは、ユーザーインターフェースとのインタラクション方法を学習するために、インターネットから頻繁に情報を取得します。しかし、ユーザーインターフェースは常に進化しているため、これらのエージェントは理論的な知識を現実世界のUIインタラクションに適用することがしばしば困難です。この乖離は「知識と行動のギャップ」と呼ばれ、AIエージェントの有効性を低下させる大きな障害となっています。

マイクロソフトが最近発表した調査は、この問題を浮き彫りにしています。最大90%の正解率で動作するAIエージェントが、タスクを正常に完了できたのはわずか41%でした。さらに、これらのエージェントは予測不可能な動作を示し、同じ操作を実行しても結果が変わることがよくあります。この不一致により、的を絞った解決策が必要になりました。

UI-Evolのご紹介

UI-Evolは、AIエージェントのワークフローにシームレスに統合される多用途コンポーネントです。UI-Evolは、実際のユーザーインターフェースから得られるリアルタイム情報を活用することで、AIのインターフェース知識を継続的に改良・更新するように設計されています。この開発により、AIエージェントの信頼性と精度が向上します。

UI-Evolの仕組み

UI-Evol は、簡単な 2 段階のアプローチを採用しています。

  • リトレース:この方法では、タスクの完了中に AI エージェントが実行するクリック、キーストローク、決定などの正確なアクションを細かく記録します。
  • 批評:この手法は、記録に続いて、エージェントの行動を既存の外部指示と比較します。矛盾が特定された場合、システムはそれに応じて知識ベースを調整し、ソフトウェア環境内で実用的かつ効果的な戦略を反映するようにします。

実証された有効性

UI-Evolの有効性を検証するため、OSWorldベンチマークを用いて、コンピュータ利用エージェントの中でもトップクラスの性能を誇るエージェントS2でテストが行​​われました。GPT -4oOpenAI-o3といった主要な大規模言語モデルで訓練されたエージェントを用いた実験では、タスク成功率の顕著な向上と一貫性の向上、そしてエージェントの行動変動の低減という、目覚ましい結果が得られました。この開発により、AIエージェントの信頼性が向上します。

将来への示唆

UI-Evolの導入により、マイクロソフトはオフィスオートメーションやバーチャルアシスタントのタスクにおけるAIエージェントの能力を大幅に強化する準備が整いました。この改善は、マイクロソフトをAI研究のリーダーとして位置付けるだけでなく、AIエージェントが様々なアプリケーションでより効率的かつ確実に動作できる未来への道を切り開きます。

画像はDepositphotos.comより

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です