MCP ツールの概要

重要

エージェントのWindows 365はパブリック プレビュー段階です。 この機能はアクティブな開発中であり、一般公開前に変更される可能性があります。

エージェントのWindows 365は、エージェント セッション のライフサイクルにマップされる 2 つの補完的なサーフェスを通じて機能を公開します。

  • 管理とセッション管理のための Microsoft Graph API。 IT 管理者、エージェント作成者、パートナー アプリケーションは、これらの API を使用して、容量を立ち上げて管理します。
  • セッション内操作のためのモデル コンテキスト プロトコル (MCP) ツール。 AI エージェントは、ライブ セッション中にこれらのツールを呼び出します。 画面共有の場合、パートナー アプリは、人間の代わりにそれらを呼び出します。

これらのサーフェスは、プールのプロビジョニング、クラウド PC の取得、作業の実行、必要に応じて監視または支援をカバーします。

Microsoft Graph API 側では、Computer-Create プレーンでは、W365A Graph APIと W365 管理ポータルが使用されます。 これらのサーフェスを通じて、管理者と独立系ソフトウェア ベンダー (ISV) 次のことができます。

  • クラウド PC エージェント プールをプロビジョニングします。
  • ポリシーとイメージを構成します。
  • 信頼されたパートナーの呼び出し元を登録します。
  • プールの数をスケーリングします。
  • MAC 課金を使用して測定をアタッチします。

Computer-Get プレーンは、パートナー アプリケーション用の小さなランタイム コントロール サーフェイスです。

  • チェックアウト呼び出しはクラウド PC を予約し、セッション ID と接続 URL を返します。
  • Checkin 呼び出しによってセッションが解放され、クラウド PC がプールに返されます。

チェックアウトはべき等であるため、再試行では重複するセッションは割り当てられません。

パートナー アプリケーションがクラウド PC を取得した後、エージェントは MCP ツールを使用して操作します。 これらのツールは開いているモデル コンテキスト プロトコルに従います。そのため、プロトコルをサポートするすべてのエージェントは、カスタム統合なしでツールを検出して呼び出すことができます。

Computer-Do は、セッション内作業のプライマリ プレーンです。 エージェントは、一連の組み込みツールを呼び出してクラウド PC を制御します。 これらのツールには次が含まれます。

  • マウス、キーボード、スクリーンショット キャプチャなどのデスクトップ操作。
  • ウィンドウ管理。
  • コマンドの実行。

ブラウザーの自動化機能と UI アクセシビリティ機能をさらに利用したり、計画したりできます。これにより、エージェントがセッション内で確実に実行できる機能が拡張されます。

人間の監督のために、パートナー アプリケーションは Computer-See を使用して、エージェントが使用しているのと同じクラウド PC セッションを監視し、必要に応じて共同駆動します。 Screenshare では、リアルタイム共有の開始と停止、マウスとキーボードのコントロールを人間に渡し、エージェントにコントロールを返す機能がサポートされています。

リモート デスクトップ スタック経由のメディアとデバイスのリダイレクト フロー: IC3 メディアを使用した仮想デスクトップとリモート デスクトップ プロトコル (RDP) のAzure。 このスタックは、標準のリモート デスクトップ セッションに匹敵する表示および制御エクスペリエンスを提供しますが、エージェントは引き続き同じセッション コンテキストで動作します。

Surface 平面 エンドポイント によって呼び出されます 用途
Graph API Computer-Create W365A Graph APIおよび W365 管理ポータル IT 管理者または ISV プールを整形して維持します。
Graph API Computer-Get セッション (チェックアウト) パートナー アプリケーション クラウド PC を予約します。
Graph API Computer-Get {sessionId}(チェックイン) パートナー アプリケーション クラウド PC を解放します。
Mcp Computer-Do Mcp AI エージェント クラウド PC を操作します。
Mcp Computer-See、Computer-TakeControl screenshare (Start、Stop、TakeControl、ReleaseControl) パートナー アプリ(人間に代わって) 観察し、協力します。

組み合わせる方法

2 つのサーフェスは順番に動作し、呼び出し元間で明確なハンドオフが行われます。

  1. 管理者とエージェント作成者は、Computer-Create を使用してプールをプロビジョニングします。
  2. パートナー アプリケーションは、Computer-Get で Checkout を呼び出して、特定のエージェント作業用にクラウド PC を予約します。
  3. AI エージェントは、Windows 365 Computer-Use MCP ツールを使用してクラウド PC を駆動します。 ほとんどの呼び出しはこのプレーンを通過します。
  4. 必要に応じて、パートナー アプリケーションは、観察または引き継ぐ人間の代わりに Computer-See を開きます。
  5. パートナー アプリケーションは、Computer-Get で Checkin を呼び出して、作業が完了したときにクラウド PC を解放します。

次の手順