你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文介绍如何从GitHub模型开始开发生成 AI 应用程序,然后使用 Microsoft Foundry Models 部署 Foundry Tools 资源来升级体验。
GitHub模型在开发生成 AI 应用程序时免费查找和试验 AI 模型时非常有用。 准备好将应用程序引入生产环境时,请在Azure订阅中部署 Foundry Tools 资源并开始使用 Foundry 模型来升级体验。 无需更改代码中的其他任何内容。
GitHub 模型的操场和免费 API 使用受到每分钟请求数、每天请求数、每个请求的令牌数和并发请求数的速率限制。 如果受到速率限制,则需要等待命中的速率限制重置,然后才能发出更多请求。
先决条件
你需要:
- 有权访问 GitHub Models 的GitHub帐户。
- 具有有效付款方式的Azure订阅。 如果您没有 Azure 订阅,请创建一个 付费 Azure 帐户以开始。 或者,可以等待,直到准备好将模型部署到生产环境,此时系统会提示创建或将Azure帐户更新为标准帐户。
- 合作伙伴和社区的 Foundry 模型需要访问 Azure 市场。 确保你拥有 订阅模型产品/服务所需的权限。 由 Azure 直接销售的 Foundry Models 没有此要求。
升级到 Foundry 模型
操场和免费 API 使用的速率限制会帮助你试验模型并开发 AI 应用程序。 在您准备好将应用程序上线时,请使用付费 Azure 帐户中的密钥和终结点。 无需更改代码中的其他任何内容。
注意
GitHub模型是免费的,但存在速率限制。 升级到 Foundry 模型后,根据所选的 部署类型对Azure订阅计费。
若要获取密钥和终结点,请执行以下操作:
转到 GitHub Models 并选择一个模型以进入其演示环境。 本文使用 Mistral Medium 3 (25.05)。
键入某些提示或使用一些建议的提示与操场中的模型交互。
在操场中选择“使用此模型”。 此操作将打开一个窗口,用于“开始在代码库中使用模型”。
在“配置身份验证”步骤中,从“Azure AI”部分选择Get Microsoft Foundry 密钥。
一个屏幕截图显示如何从GitHub模型的页面获取Azure AI的生产密钥。 如果已登录到Azure帐户,请跳过此步骤。 但是,如果没有Azure帐户或未登录到帐户,请执行以下步骤:
如果没有Azure帐户,请选择创建帐户并按照步骤创建一个帐户。
或者,如果你有Azure帐户,请选择重新登录。 如果现有帐户是免费帐户,则首先必须升级到标准计划。
返回到模型的操场,然后再次选择 获取 Microsoft Foundry key。
登录到Azure帐户。
你被带到 Foundry > GitHub并进入 Foundry 项目的主页。
提示
如果登录 Foundry (经典) 体验,请切换右上角导航中的 New Foundry 切换器以切换到新的 Foundry 体验。
按照 “部署模型 ”中的步骤部署所选模型,在 Playground 中测试模型,并使用代码推断已部署的模型。
通过在 Playground 中发送测试提示来验证部署是否正常工作。 如果收到响应,则模型已准备好可通过代码使用。
重要
与所有模型已配置完成的 GitHub 模型不同,Foundry Tools 资源允许你控制哪些模型可以在你的端点中使用,以及在何种配置下使用。 在 model 参数中指示模型之前,请添加你计划使用的任意数量的模型。 了解如何向资源 添加更多模型 。
探索其他功能
Foundry Models 支持GitHub模型中不可用的功能:
- Model 目录 - 浏览、比较和评估来自Azure、合作伙伴和开源社区的模型。
- 无密钥身份验证 - 无需管理 API 密钥即可对基于令牌的身份验证使用Microsoft Entra ID。
- 内容筛选 - 为部署配置内容安全筛选器。
- 速率限制 - 为资源中的特定模型设置自定义速率限制。
- 部署类型 - 从多个部署 SKU 中进行选择,例如按令牌付费、预配和批处理。
排查常见问题
| 问题 | 分辨率 |
|---|---|
| 您所在的区域不提供此模型 | 在其 模型目录页上 检查模型的区域可用性,并选择受支持的区域。 |
| 密钥交换后的身份验证错误 | 验证是否已从 Foundry 门户复制正确的密钥。 选择项目设置>密钥和终结点以查看您的密钥。 |
| 升级后的速率限制错误 | Foundry 模型速率限制取决于 部署类型。 纵向扩展或选择更高的吞吐量部署。 |