適用対象:Foundry (クラシック) ポータル。 この記事は、新しい Foundry ポータルでは使用できません。
新しいポータルの詳細を確認します。
メモ
この記事のリンクは、現在表示している Foundry (クラシック) ドキュメントではなく、新しい Microsoft Foundry ドキュメントのコンテンツを開く場合があります。
この記事では、デプロイの作成に使用されたものとは異なるプロジェクトまたはハブで既存のサーバーレス API を構成する方法について説明します。
重要
プレビュー段階のモデルは、モデル カタログ内のモデル カードで プレビュー としてマークされます。
モデル カタログ内の特定のモデル は、サーバーレス API としてデプロイできます。 この種のデプロイでは、組織が必要とするエンタープライズのセキュリティとコンプライアンスを維持しながら、サブスクリプションでモデルをホストせずに API として使用する方法が提供されます。 このデプロイ オプションでは、サブスクリプションからのクォータは必要ありません。
デプロイの作成に使用されたものとは異なるプロジェクトまたはハブでサーバーレス API エンドポイントを使用する必要がある場合は、次のような状況で発生する可能性があります。
- 特定のプロジェクトまたはハブでデプロイを一元化し、組織内のさまざまなプロジェクトまたはハブからデプロイを使用する必要があります。
- 特定のAzure リージョンのハブにモデルをデプロイする必要があります。このリージョンでは、そのモデルのサーバーレス デプロイを使用できます。 ただし、特定のモデルでサーバーレスデプロイを使用できない別のリージョンから使用する必要があります。
前提 条件
有効な支払い方法を持つAzure サブスクリプション。 無料または試用版Azureサブスクリプションは機能しません。 Azureサブスクリプションをお持ちでない場合は、有料 Azure アカウントを作成して開始します。
Microsoft Foundry ハブ (hub ベースのプロジェクトを使用している場合)。 Foundry プロジェクトはハブを使用しません。 詳細については、「Project 型を参照してください。
ない場合は、 ハブベースのプロジェクトを作成します。
サーバーレス API にデプロイされたモデル。 この記事では、以前に Meta-Llama-3-8B-Instruct モデルをデプロイしたことを前提としています。 このモデルをサーバーレス API としてデプロイする方法については、「サーバー レス API としてモデルをデプロイする」を参照してください。
Foundry を使用するには、次のソフトウェアをインストールする必要があります。
任意の互換性のある Web ブラウザーを使用して Foundry 内を移動できます。
サーバーレス API エンドポイント接続を作成する
接続を作成するには、次の手順に従います。
エンドポイントがデプロイされているプロジェクトまたはハブに接続します。
接続先のエンドポイントの URL と資格情報を取得します。 この例では、エンドポイント名 meta-llama3-8b-qwerty の詳細を取得します。
Foundry ポータルのプロジェクトの左側のサイドバーから、[ マイ アセット>Models + エンドポイント ] に移動して、プロジェクト内のデプロイの一覧を表示します。
接続するデプロイメントを選択します。
ターゲット URI とキーの値をコピーします。
次に、接続を作成するプロジェクトまたはハブ に接続します。
接続を作成する必要があるプロジェクトに移動します。
プロジェクトで接続を作成します。
Foundry ポータルのプロジェクトから、左側のサイドバーの下部に移動し、[ 管理センター] を選択します。
管理センターの左側のサイドバーで、[ 接続されているリソース] を選択します。
[ 新しい接続] を選択します。
[サーバーレス モデル] を選択します。
ターゲット URI には、前にコピーした値を貼り付けます。
[キー] に、前にコピーした値を貼り付けます。
接続に名前を付けます (この場合 は meta-llama3-8b-connection)。
[ 接続の追加] を選択します。
この時点で、接続が利用可能です。
接続が機能していることを検証するには:
Foundry ポータルでプロジェクトに戻ります。
プロジェクトの左側のサイドバーから、 ビルドとカスタマイズ>Prompt フローに移動します。
[ 作成] を選択して新しいフローを作成します。
[チャット フロー] ボックスで [作成] を選択します。
プロンプト フローに名前を付け、[作成] を選択します。
グラフから チャット ノードを選択して、 チャット セクションに移動します。
[接続] でドロップダウン リストを開き、先ほど作成した接続 (この場合は meta-llama3-8b-connection) を選択します。
上部のナビゲーション バーから [ コンピューティング セッションの開始 ] を選択して、プロンプト フローの自動ランタイムを開始します。
[ チャット ] オプションを選択します。 メッセージを送信して応答を取得できるようになりました。