生成 AI モデルの使用

完了

詳細については、「 テキストと画像 」タブを参照してください。

デプロイされたモデルを操作する最も簡単な方法は、Foundry ポータルでモデルのプレイグラウンドを使用することです。 Foundry Playgrounds を使用して、コードを記述する前にプロンプトの試行、モデルの比較、作業設定のキャプチャを行うことができます。

Foundry プレイグラウンドのスクリーンショット。

主要な構成パラメーター

いくつかの モデル引数 または パラメーター は、ランタイムの動作、パフォーマンス、コストに影響します。 プレイグラウンドの設定では、 温度最大出力トークンシステム命令などのパラメーターを構成できます。 プレイグラウンド チャット インターフェイスでは、プロンプトを送信し、モデルによって生成された応答を確認できます。

  • 温度: 創造性と決定主義を制御します。
  • 最大出力トークン – 応答の長さを制限します。トークンの消費量や調整動作に影響します。
  • システム命令 – モデルの動作と役割を設定します。

エンド ユーザーの要求または質問 (例: 移動する必要がある場所) であるユーザー プロンプトとは異なり、 システム プロンプト はアシスタントの動作、トーン、ツール、ガードレールを設定します。 システム プロンプトの例として、「あなたは役に立つ、ステップバイステップの家庭教師です。 ソースを引用します。 医療に関するアドバイスを辞退する」

プレイグラウンドは、Foundryとコードの間の便利な橋です。 代表的なプロンプトをテストした後は、コード内で同じシステム プロンプトとユーザー プロンプトとパラメーター値を使用できます。 プレイグラウンドには、OpenAI と互換性のある Responses API を介して Foundry デプロイを呼び出すことができるコードが用意されています。 このコードは基本的に、チャット インターフェイスを使用して設定を構成し、ユーザー プロンプトを送信するときに実行されます。

プレイグラウンドに基づく Foundry ポータルのコード例のスクリーンショット。

このコードは、独自のチャット クライアントを作成するための開始点として使用できます。

Foundry SDK を使用して軽量のチャット クライアントを作成する

軽量クライアント アプリケーションは、ユーザー入力の収集リモート サービス/API の呼び出し結果の表示を主なジョブとする、小規模で最小限のアプリです。多くの UI フレームワーク、複雑なバックエンド ロジック、または大規模なローカル依存関係はありません。 実際には、通常は次のようになります。

  • CLI (コマンド ライン インターフェイス)、小規模なデスクトップ ユーティリティ、または単純な Web ページとして実行されます。
  • 状態を保持し、主にサーバー上で計算します (モデルはリモートで実行されます)。
  • コードフットプリントが小さく、構成が最小限です (多くの場合、環境変数と短いスクリプトのみ)。
  • プロトタイプ作成が簡単で、ローカルで実行しやすく、後で簡単に拡張できます。

Foundry の場合、軽量のチャット クライアントは、多くの場合、Foundry プロジェクト エンドポイントに接続し、デプロイされたモデルにチャット メッセージを送信するsingle Python ファイルです。 Foundry SDK は、Responses API を介してモデルを呼び出すための Project クライアント (Foundry ネイティブ操作) と OpenAI 互換クライアントを公開します。 ほとんどのアプリでは、両方を使用します。

Python チャット クライアントを構築する

Foundry プロジェクトを作成し、チャット モデル (gpt-4.1 など) をデプロイしたら、Foundry SDK を使用できます。 この例では、クライアント アプリケーションは認証を使用してモデルのエンドポイントに接続し、プロンプトを送信し、応答を表示します。

# pip install openai>=1.3.0
# pip install azure-ai-projects azure-identity openai

import os
from openai import OpenAI

client = OpenAI(
    base_url=f"{os.environ['AZURE_OPENAI_ENDPOINT']}/openai",
    api_key=os.environ["AZURE_OPENAI_API_KEY"]
)

response = client.responses.create(
    model=os.environ["DEPLOYMENT_NAME"],          # e.g., "gpt-4o-mini"
    input=[{"role": "system", "content": "You're a helpful assistant."},
           {"role": "user", "content": "Summarize the key points from our release notes in 3 bullets."}],
    max_output_tokens=300,
    temperature=0.7
)

print(response.output_text)

モデルとエージェントの違いを理解する

Microsoft Foundry では、 生成 AI モデルエージェント は関連していますが、さまざまな目的に対応します。 次の方法で考えることができます。

  • モデル = 未加工インテリジェンス
  • エージェント = そのインテリジェンスの上に構築されたパッケージ化されたタスク指向のワーカー

生成 AI モデルを単独で使用する場合:

  • 純粋な推論が必要な場合: "このプロンプトを表示し、出力を生成します。"
  • プレイグラウンドで実験を行っている
  • OpenAI Responses API を使用してモデルを呼び出します

次に、Foundry でエージェントを作成する方法について説明します。