
Microsoftは最近、画期的な開発を発表しました。Windows 11は、音声コマンドを軸とした画期的なCopilot Actionsを搭載した、いわゆる「Agentic OS」へと進化します。これにより、ユーザーはPCに音声でタスクを実行させることができるようになり、物理的な入力が不要になり、ユーザーインタラクションに革命をもたらします。
この発表に先立つ数日間、マイクロソフトはソーシャルメディアプラットフォーム上で「あなたの手はもうすぐPTOになるよ」や「見て、ママ、手がないわ」といった冗談めいた発言でWindowsに関する話題を盛り上げていた。これらのスローガンは、従来のマウスとキーボードによる操作がもうすぐ過去のものになるかもしれないという同社の野心的なWindows 2030ビジョンを垣間見せている。
エージェントOSの概念を理解する
Copilot Actionsの導入はWindows 11にとって大きな機能強化であり、ユーザーエクスペリエンスを変革する可能性を秘めています。Copilot機能は当初5月にWebアプリケーション向けに発表されましたが、Windows 11への統合により、ユーザーはより高度なAI支援を受けることができます。
Copilot Actions により、Windows 11 は Agentic OS として機能します。Agentic OS は、ユーザーに代わって自律的に思考、計画、タスク実行を行う AI エージェントを管理・オーケストレーションするために設計されたオペレーティング システムです。この OS は、これらの AI エージェントを安全な環境でアプリケーションやサービスに接続するプラットフォームとして機能します。
この機能は、2024 年 11 月に Anthropic によって確立されたフレームワークである Model Context Protocol (MCP) によって実現されます。MCP により、Windows 11 内の AI エージェントは、従来のマウスとキーボードに依存せずに、ドキュメントの編集、ワークフローの開始、さまざまなシステム機能との対話など、ネイティブ アプリケーション全体でタスクをシームレスに探索、整理、実行できるようになります。
Copilot Actions は Windows 11 に不可欠な AI 機能ですが、デフォルトでは無効になっています。この機能を利用するには、Copilot アプリの設定で試験的なエージェント機能を有効にする必要があります。

Windows における AI 統合に関する Microsoft のビジョンは、主に次の 3 つの目標を中心に展開されています。
- Copilot Voice を活用し、テキストまたは音声コマンドによる PC との自然な対話を促進します。
- Copilot Vision を通じて PC がユーザーの動作を認識し、さまざまなタスクを支援できるようにします。
- PC が Copilot Actions を介してタスクを自律的に完了し、ワークフローを管理できるようにします。
音声アクティベーションがユーザーインタラクションをどのように変革するか
Copilot Actionsの起動は、「Hey Copilot」というコマンドから始まります。これはCopilot設定で設定できるウェイクワードです。従来のスマートアシスタントとは異なり、Microsoftはユーザーが単に質問を投げかけるのではなく、効率的にタスクを完了できるシナリオを想定しています。
起動すると、Copilot Voice はコマンドを解釈し、アプリケーションの起動、ドキュメントの変更、口頭の指示に基づいたアクションの完了などのタスクを実行します。
例えば、ポートフォリオサイトを開いていて、それを職務経歴書に変換したい場合、「Copilotさん、ポートフォリオを職務経歴書に変換してください」と話しかけるだけで済みます。Copilot Voiceがリクエストを処理し、Copilot Visionの助けを借りて画面上のコンテンツを分析します。その後、Copilot ActionsがWordで新規ドキュメントを作成し、音声指示のみに基づいて職務経歴書を作成します。マウスやキーボードは必要ありません。このインタラクションは、Jarvisのような映画のような高度なAI環境の実現にどれほど近づいているかを示しています。
タスクが完了すると、Copilot は一定時間操作がないと自動的にセッションを終了します。または、「さようなら」と音声で指示して終了することもできます。また、従来のマウスクリックによる終了も可能です。
Copilot Actions がリクエストを処理している間でも、Windows 11 内のすべての AI エージェントに割り当てられた独立した環境のおかげで、ユーザーは PC で他のアクティビティを実行できます。Copilot Actions によって実行されている進行中のタスクをリアルタイムで追跡できるため、ユーザーはいつでも制御を行うことができます。
エージェントモードのセキュリティに関する考慮事項
AI機能の導入に伴い、プライバシーとセキュリティに関する懸念が生じます。特にユーザーがファイルやデスクトップ環境への広範なアクセスを許可する場合、懸念が高まります。しかし、MicrosoftはCopilot Actionsに対するユーザーによる制御を重視しており、いつでもこの機能を一時停止または無効化できます。
現時点では、Copilot Actions はまだテスト段階ですが、Microsoft は徐々に機能をより幅広いユーザー層に展開し、インテリジェント コンピューティングの新しい時代の到来を告げています。
Windows 11 PC での Copilot Actions の利用可能性
Microsoft の最近の発表では、同社のエグゼクティブ バイス プレジデントのブログ記事のタイトル「すべての Windows 11 PC を AI PC に」に示されているように、Copilot Actions はすべての Windows 11 ユーザーが利用できるようになることが示唆されています。発表では、Copilot Voice、Vision、または Actions の特定のハードウェアでの利用に関する制限がまったく示されていませんでした。
デモで紹介された高度な機能の中には、最適なパフォーマンスを得るために最新のプロセッサを必要とするものもありますが、厳格なハードウェア要件がないことは、Microsoft が Copilot+ 専用モデルに重点を置くことから戦略を転換したことを示しています。
現在、「Hey Copilot」と Copilot Vision はグローバル展開を開始しており、Windows Insider 向けには近々さらに多くの機能が提供される予定です。
コメントを残す