ホストされるエージェントをデプロイする

この記事では、Python SDK または REST API を使用して、コンテナー化されたエージェントを Foundry Agent Service にデプロイする方法について説明します。独自のアプリケーションまたはサービスからエージェントのデプロイを直接管理する場合は、次の方法を使用します。

初めてデプロイする場合、または最速のパスが必要な場合は、「クイックスタート: ホストされたエージェントを作成してデプロイする」を使用してください。このクイックスタートではAzure Developer CLI (azd) または VS Code 拡張機能 を使用します。これにより、ビルド、プッシュ、バージョン管理、RBAC の構成が自動的に処理されます。

デプロイのライフサイクル

すべてのホステッドエージェントの展開は、次の順序に従います。

Build と push — エージェントコードをコンテナーイメージにパッケージ化し、Azure Container Registryにプッシュします。
エージェントバージョンを作成する - Foundry Agent Service にイメージを登録します。プラットフォームはインフラストラクチャをプロビジョニングし、専用の Entra エージェント ID を作成します。
状態確認、バージョンの状態が activeに達するまで待ちます。
Invoke — エージェントの専用エンドポイントに要求を送信します。

前提条件

Microsoft Foundry プロジェクト。
サポートされているフレームワークを使用するエージェントコード。
ローカルコンテナー開発用にインストールされた Docker Desktop。
Azure CLI バージョン 2.80 以降。

必要なアクセス許可

ホスト型エージェントを作成してデプロイするには、projectスコープで Azure AI Project Manager が必要です。このロールには、エージェントを作成するためのデータプレーンのアクセス許可と、プラットフォームで作成されたエージェント ID に Azure AI User ロールを割り当てる機能の両方が含まれます。エージェント ID は、実行時にモデルと成果物にアクセスするために、プロジェクトで Azure AI User を必要とします。

azdまたは VS Code 拡張機能を使用する場合、ツールは、次のようなほとんどの RBAC 割り当てを自動的に処理します。

プロジェクトマネージド ID のContainer Registry リポジトリ閲覧者 (イメージのプル)
プラットフォームで作成されたエージェント ID 向けの Azure AI ユーザー (ランタイムモデルとツールアクセス)

メモ

プラットフォームは、デプロイ時に各ホストエージェントの専用の Entra エージェント ID を作成します。この ID は、実行中のコンテナーがモデルとツールを呼び出すために使用するサービスプリンシパルです。マネージド ID を手動で構成する必要はありません。ただし、エージェントを作成するユーザーには、Azure AI ユーザーをその ID に割り当てるアクセス許可が必要です。そのため、Azure AI Project Manager は、Azure AI ユーザーよりも推奨されます。

メモ

azd 拡張機能と VS Code 拡張機能は基本的な RBAC 割り当てを自動的に処理しますが、複雑なシナリオでは追加の手動構成が必要になる場合があります。関連するすべてのアクセス許可とロールの割り当てに関する包括的な詳細については、 Hosted Agent のアクセス許可リファレンスを参照してください。

詳細については、「認証と承認」を参照してください。

重要

ホステッドエージェントのコンテナーイメージを保持するAzure Container Registryは、現在、パブリックエンドポイント経由で到達可能である必要があります。プライベートネットワーク (パブリックネットワークアクセスが無効なプライベートエンドポイント) の背後にレジストリを配置することは、現在、ホストされているエージェントではサポートされていません。プラットフォームはイメージをプルできません。ネットワーク制約の完全な一覧については、「制限事項」を参照してください。

コンテナーの要件

ホストされるエージェントプラットフォームで実行するには、コンテナーイメージが次の要件を満たしている必要があります。

重要

ホスティングプラットフォームには、x86_64 (linux/amd64) コンテナーイメージが必要です。 Apple Silicon またはその他の ARM ベースのマシン上に構築する場合は、互換性のない ARM イメージが生成されないように、 docker build --platform linux/amd64 . を使用します。

プロトコルライブラリ

ホストされるエージェントは、プロトコルライブラリを介して Foundry ゲートウェイと通信します。エージェントの対話パターンに一致するプロトコルを選択します。

プロトコル	Python ライブラリ	.NET ライブラリ	エンドポイント	〜に最適です
応答	`azure-ai-agentserver-responses`	`Azure.AI.AgentServer.Responses`	`/responses`	会話型チャットボット、ストリーミング、プラットフォームで管理された履歴を含むマルチターン
呼び出し	`azure-ai-agentserver-invocations`	`Azure.AI.AgentServer.Invocations`	`/invocations`	Webhook レシーバー、非会話処理、カスタム非同期ワークフロー

1 つのコンテナーで 両方のプロトコルを同時に 公開するには、 agent.yaml ファイル、SDK 呼び出し、または REST API 要求でエージェントを作成するときに両方を宣言し、両方のライブラリをインポートします。既存のフレームワーク内で、Microsoft Agent Framework、LangChain、またはカスタムコードにかかわらず、プロトコルライブラリを使用します。

応答プロトコルライブラリ

Responses プロトコルのPythonライブラリと.NET ライブラリは、Azure AI Responses API を実装します。パッケージをインポートし、 IResponseHandler インターフェイスを実装します。ライブラリは、ルーティング、サーバー送信イベント (SSE) によるストリーミング、バックグラウンド実行、キャンセル、キャッシュ、応答ライフサイクル管理を処理します。

IResponseHandler

IResponseHandler は、実装するコア抽象化です。ライブラリは、受信要求ごとに CreateAsync を呼び出し、返された IAsyncEnumerable<ResponseStreamEvent> を SSE 経由でクライアントに配信します。

public class EchoHandler : ResponseHandler
{
    public override IAsyncEnumerable<ResponseStreamEvent> CreateAsync(
        CreateResponse request,
        ResponseContext context,
        CancellationToken cancellationToken)
    {
        return new TextResponse(context, request,
            createText: async ct =>
            {
                var input = await context.GetInputTextAsync(cancellationToken: ct);
                return $"Echo: {input}";
            });
    }
}

ResponseEventStream

ResponseEventStream は、 sequenceNumber、 outputIndex、 contentIndex、 itemId、および完全な Response ライフサイクルを自動的に管理します。各 yield return は 1 対 1 を SSE イベントにマップするため、この状態を自分で追跡する必要はありません。

ストリーミングモードとバックグラウンドモード

ストリーミングモード (既定): SSE イベントは、接続されているクライアントにリアルタイムで配信されます。
バックグラウンドモード: ハンドラーは、接続された SSE クライアントなしで完了まで実行されます。イベントはバッファーに格納され、 GET /responses/{id}経由で再生できます。

応答のライフサイクル

ライブラリは、 created → in_progress → completed (または failed または cancelled) の完全な応答ライフサイクルを調整します。ライブラリでは、取り消し、エラー処理、およびターミナルイベントの保証も自動的に管理されます。

スレッドセーフティ

AddResponsesServer()を介して登録されたすべてのサービスインスタンスはスレッドセーフです。ハンドラーインスタンスは要求ごとにスコープ指定されます。

ハンドラー実装の詳細なガイダンスについては、handler 実装ガイドを参照してください。実行可能な例については、Responses プロトコルのサンプルを参照してください。

ヘルスエンドポイント

プロトコルライブラリは、プラットフォームの正常性チェック用の /readiness エンドポイントを自動的に公開します。これを自分で実装する必要はありません。

ポート

コンテナーは、ポート 8088 のトラフィックをローカルで処理します。運用環境では、Foundry ゲートウェイがルーティングを処理します。コンテナーでパブリックポートを公開する必要はありません。

プラットフォームによって挿入された環境変数

ホストされるエージェントプラットフォームは、実行時に環境変数をコンテナーに自動的に挿入します。コードでは、 agent.yaml または environment_variablesで宣言しなくても、これらを読み取ることができます。 FOUNDRY_* プレフィックスは、プラットフォームで使用するために予約されています。

変数	目的
`FOUNDRY_PROJECT_ENDPOINT`	Foundry プロジェクトエンドポイント URL
`FOUNDRY_PROJECT_ARM_ID`	Foundry プロジェクトの ARM リソース ID
`FOUNDRY_AGENT_NAME`	実行中のエージェントの名前
`FOUNDRY_AGENT_VERSION`	実行中のエージェントのバージョン
`FOUNDRY_AGENT_SESSION_ID`	現在の要求のセッション ID (ホストされているコンテナーのみ)
`APPLICATIONINSIGHTS_CONNECTION_STRING`	テレメトリ用の Application Insights 接続文字列

プラットフォームによって挿入された変数を agent.yaml で再宣言しないでください。これらは自動的に設定されます。

MODEL_DEPLOYMENT_NAMEやツールボックスの MCP エンドポイントなど、自分で宣言する変数は、environment_variablesまたは SDK agent.yaml呼び出しのcreate_versionセクションに移動します。

エージェントをローカルでパッケージ化してテストする

Foundry にデプロイする前に、エージェントがプロトコルライブラリを使用してローカルで動作することを検証します。コンテナーは、運用環境と同じエンドポイントをローカルで処理します。

応答プロトコルをテストする

POST http://localhost:8088/responses
Content-Type: application/json

{
    "input": "Where is Seattle?",
    "stream": false
}

呼び出しプロトコルをテストする

POST http://localhost:8088/invocations
Content-Type: application/json

{
    "message": "Hello!"
}

Azure Developer CLI または VS Code を使用してデプロイする

Azure Developer CLI (azd) と VS Code 拡張機能により、完全なデプロイライフサイクルが自動化されます。詳細なチュートリアルについては、「クイックスタート: ホスト型エージェントの作成とデプロイ」を参照してください。

Python SDK を使用してデプロイする

エージェントのデプロイをコードから直接管理する場合は、SDK Python使用します。

その他の前提条件

Python 3.10 以降
Azure Container Registry のコンテナーイメージ
コンテナーレジストリのリポジトリライター または AcrPush 役割 (イメージをプッシュするための役割)
Azure AI Projects SDK バージョン 2.1.0 以降
```
pip install "azure-ai-projects>=2.1.0"
```

コンテナーイメージをビルドしてプッシュする

Docker イメージをビルドします。
```
docker build --platform linux/amd64 -t myagent:v1 .
```
Python および C# の Dockerfile のサンプルを参照してください。

Azure Container Registryにプッシュする:

az acr login --name myregistry
docker tag myagent:v1 myregistry.azurecr.io/myagent:v1
docker push myregistry.azurecr.io/myagent:v1

ヒント

再現可能なデプロイには、 :latest の代わりに一意のイメージタグを使用します。

コンテナーレジストリのアクセス許可を構成する

プロジェクトのマネージド ID にプルイメージへのアクセス権を付与します。

Azure ポータルで、Foundry プロジェクトリソースに移動します。
Identity を選択し、システム割り当て済み の下にあるオブジェクト (プリンシパル) ID をコピーします。
コンテナーレジストリのリポジトリ閲覧者ロールを、コンテナーレジストリのこの ID に割り当てます。 Azure Container Registryのロールとアクセス許可についてご参照ください。

ホストされるエージェントのバージョンを作成する

バージョンを作成すると、エージェントを自動的にプロビジョニングするプラットフォームがトリガーされます。別の開始手順はありません。プラットフォームによってコンテナースナップショットが作成され、エージェントが要求を処理する準備が整います。

from azure.ai.projects import AIProjectClient
from azure.ai.projects.models import HostedAgentDefinition, ProtocolVersionRecord, AgentProtocol
from azure.identity import DefaultAzureCredential

# Format: "https://resource_name.services.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project client
credential = DefaultAzureCredential()
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=credential,
    allow_preview=True,
)

# Create a hosted agent version
agent = project.agents.create_version(
    agent_name="my-agent",
    definition=HostedAgentDefinition(
        container_protocol_versions=[
            ProtocolVersionRecord(protocol=AgentProtocol.RESPONSES, version="1.0.0")
        ],
        cpu="1",
        memory="2Gi",
        image="your-registry.azurecr.io/your-image:tag",
        environment_variables={
            "MODEL_DEPLOYMENT_NAME": "gpt-5-mini"
        }
    )
)

print(f"Agent created: {agent.name}, version: {agent.version}")

両方のプロトコルを公開するには、両方を container_protocol_versions渡します。

container_protocol_versions=[
    ProtocolVersionRecord(protocol=AgentProtocol.RESPONSES, version="1.0.0"),
    ProtocolVersionRecord(protocol=AgentProtocol.INVOCATIONS, version="1.0.0")
],

キーパラメーター:

パラメーター	説明
`agent_name`	一意の名前 (ハイフン付きの英数字、最大 63 文字)
`image`	完全な Azure Container Registry イメージのURLとタグ
`cpu`	CPU の割り当て (たとえば、 `"1"`)
`memory`	メモリの割り当て (たとえば、 `"2Gi"`)
`container_protocol_versions`	コンテナーが公開するプロトコル (`responses`、 `invocations`、またはその両方)

バージョンのステータスを確認する

バージョンを作成した後、エージェントを呼び出す前に状態が active されるまでポーリングします。通常、プロビジョニングにはイメージサイズに応じて 1 分未満かかります。

import time

# Poll until the agent version is active
while True:
    version_info = project.agents.get_version(
        agent_name="my-agent",
        agent_version=agent.version
    )
    status = version_info["status"]
    print(f"Status: {status}")

    if status == "active":
        print("Agent is ready!")
        break
    elif status == "failed":
        print(f"Provisioning failed: {version_info['error']}")
        break

    time.sleep(5)

バージョンの状態の値:

ステータス	説明
`creating`	インフラストラクチャのプロビジョニングが進行中
`active`	エージェントは要求を処理する準備ができています
`failed`	プロビジョニングに失敗しました - 詳細については、 `error` フィールドを確認してください
`deleting`	バージョンがクリーンアップされています
`deleted`	バージョンが完全に削除されました

エージェントを呼び出す

バージョンが active 状態になったら、 get_openai_client を使用して、エージェントのエンドポイントにバインドされた OpenAI クライアントを作成します。

応答プロトコルについて

# Create an OpenAI client bound to the agent endpoint
openai_client = project.get_openai_client(agent_name="my-agent")

response = openai_client.responses.create(
    input="Hello! What can you do?",
)

print(response.output_text)

呼び出しプロトコルの場合は、呼び出しエンドポイントを直接呼び出します。

import requests

token = credential.get_token("https://ai.azure.com/.default").token
url = f"{PROJECT_ENDPOINT}/agents/my-agent/endpoint/protocols/invocations"

response = requests.post(url, headers={
    "Authorization": f"Bearer {token}",
    "Content-Type": "application/json",
    "Foundry-Features": "HostedAgents=V1Preview"
}, params={"api-version": "v1"}, json={
    "message": "Process this task"
})

print(response.json())

詳細な例については、ホストされるエージェントのサンプルを参照してください。

REST API を使用してデプロイする

HTTP ベースの直接デプロイやカスタムツールとの統合に REST API を使用します。

開始する前に、コンテナーイメージをビルドしてプッシュし、コンテナーレジストリのアクセス許可を構成します。

変数を設定する

BASE_URL="https://{account}.services.ai.azure.com/api/projects/{project}"
API_VERSION="v1"
TOKEN=$(az account get-access-token --resource https://ai.azure.com --query accessToken -o tsv)

エージェントを作成する

curl -X POST "$BASE_URL/agents?api-version=$API_VERSION" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "name": "my-agent",
    "definition": {
      "kind": "hosted",
      "image": "myacr.azurecr.io/my-agent:v1",
      "cpu": "1",
      "memory": "2Gi",
      "container_protocol_versions": [
        {"protocol": "responses", "version": "1.0.0"}
      ],
      "environment_variables": {
        "MODEL_DEPLOYMENT_NAME": "gpt-5-mini"
      }
    }
  }'

エージェントを作成すると、バージョン 1 も作成され、プロビジョニングがトリガーされます。

バージョンのステータスを確認する

statusがactiveされるまで、バージョンエンドポイントをポーリングします。

while true; do
  STATUS=$(curl -s -X GET "$BASE_URL/agents/my-agent/versions/1?api-version=$API_VERSION" \
    -H "Authorization: Bearer $TOKEN" | jq -r '.status')
  echo "Status: $STATUS"
  [ "$STATUS" = "active" ] && echo "Ready!" && break
  [ "$STATUS" = "failed" ] && echo "Provisioning failed." && exit 1
  sleep 5
done

エージェントを呼び出す

エージェントの専用エンドポイントを使用して要求を送信します。サーバー送信イベントを受信するように "stream": true を設定します。

応答プロトコル:

curl -X POST "$BASE_URL/agents/my-agent/endpoint/protocols/openai/responses?api-version=$API_VERSION" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "input": "Hello! What can you do?",
    "store": true
  }'

呼び出しプロトコル:

curl -X POST "$BASE_URL/agents/my-agent/endpoint/protocols/invocations?api-version=$API_VERSION" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -H "Foundry-Features: HostedAgents=V1Preview" \
  -d '{
    "message": "Process this task"
  }'

新しいバージョンを作成する

新しいバージョンを作成して、更新されたコードまたは構成をデプロイします。

curl -X POST "$BASE_URL/agents/my-agent/versions?api-version=$API_VERSION" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "definition": {
      "kind": "hosted",
      "image": "myacr.azurecr.io/my-agent:v2",
      "cpu": "1",
      "memory": "2Gi",
      "container_protocol_versions": [
        {"protocol": "responses", "version": "1.0.0"}
      ],
      "environment_variables": {
        "MODEL_DEPLOYMENT_NAME": "gpt-5-mini"
      }
    }
  }'

リソースのクリーンアップ

料金の発生を防ぐために、処理が完了したらリソースをクリーンアップします。エージェントコンピューティングは、非アクティブ状態が 15 分続くとプロビジョニングが解除されるため、エージェントが要求を処理していない場合はコストはかからなくなります。

Azure Developer CLI のクリーンアップ

azd down

SDK のクリーンアップ

1 つのバージョンを削除します。

project.agents.delete_version(agent_name="my-agent", agent_version=agent.version)

または、エージェント全体とそのすべてのバージョンを削除します。

project.agents.delete(agent_name="my-agent")

REST API のクリーンアップ

1 つのバージョンを削除します。

curl -X DELETE "$BASE_URL/agents/my-agent/versions/1?api-version=$API_VERSION" \
  -H "Authorization: Bearer $TOKEN"

または、エージェント全体を削除します。

curl -X DELETE "$BASE_URL/agents/my-agent?api-version=$API_VERSION" \
  -H "Authorization: Bearer $TOKEN"

警告

エージェントを削除すると、そのバージョンがすべて削除され、アクティブなセッションが終了します。この操作を元に戻すことはできません。

トラブルシューティング

プロビジョニングエラーは、バージョンオブジェクトの error.code フィールドと error.message フィールドに表示されます。作成後にバージョンの状態を確認して、問題を特定します。

エラーコード	HTTP コード	ソリューション
`image_pull_failed`	400	イメージ URI が正しく、プロジェクトマネージド ID に ACR の Container Registry Repository Reader があることを確認します
`SubscriptionIsNotRegistered`	400	サブスクリプションプロバイダーを登録する
`InvalidAcrPullCredentials`	401	マネージド ID またはレジストリ RBAC を修正する
`UnauthorizedAcrPull`	403	正しい資格情報または ID を指定する
`AcrImageNotFound`	404	イメージ名/タグを修正するか、イメージを発行する
`RegistryNotFound`	400/404	レジストリ DNS またはネットワークの到達可能性を修正する

5xx エラーについては、Microsoftサポートにお問い合わせください。

RBAC の要件とアクセス許可のトラブルシューティングの詳細については、ホストされるエージェントのアクセス許可のリファレンスを参照してください。

次の手順

ホストされるエージェントのライフサイクルを管理する

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-08

ホストされるエージェントをデプロイする

デプロイのライフサイクル

前提 条件

必要なアクセス許可

コンテナーの要件

プロトコル ライブラリ

応答プロトコル ライブラリ

IResponseHandler

ResponseEventStream

ストリーミング モードとバックグラウンド モード

応答のライフサイクル

スレッドセーフティ

ヘルスエンドポイント

ポート

プラットフォームによって挿入された環境変数

エージェントをローカルでパッケージ化してテストする

応答プロトコルをテストする

呼び出しプロトコルをテストする

Azure Developer CLI または VS Code を使用してデプロイする

Python SDK を使用してデプロイする

その他の前提条件

コンテナー イメージをビルドしてプッシュする

コンテナー レジストリのアクセス許可を構成する

ホストされるエージェントのバージョンを作成する

バージョンのステータスを確認する

エージェントを呼び出す

REST API を使用してデプロイする

変数を設定する

エージェントを作成する

バージョンのステータスを確認する

エージェントを呼び出す

新しいバージョンを作成する

リソースのクリーンアップ

Azure Developer CLI のクリーンアップ

SDK のクリーンアップ

REST API のクリーンアップ

トラブルシューティング

次の手順

関連コンテンツ

フィードバック

その他のリソース

前提条件

プロトコルライブラリ

応答プロトコルライブラリ

ストリーミングモードとバックグラウンドモード

コンテナーイメージをビルドしてプッシュする

コンテナーレジストリのアクセス許可を構成する