你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

创建索引的 OneLake 知识源

注意

此智能检索功能在 2026-04-01 REST API 版本中通过编程接口普遍可用。 Azure门户和 Microsoft Foundry 门户继续提供对所有代理检索功能的仅限预览的访问权限。有关迁移指南，请参阅将代理检索代码迁移到最新版本。

使用 索引的 OneLake 知识源为 OneLake 文件编制索引，并在代理检索流水线中进行查询。知识源是独立创建的，在知识库中引用，并在代理或聊天机器人在查询时调用检索操作时用作基础数据。

创建索引的 OneLake 知识源时，可以指定外部数据源、模型和属性，以自动生成以下Azure AI 搜索对象：

表示湖仓的一个数据源。
一个技能集能够对来自数据湖仓的多模态内容进行分块，并可选择性地进行向量化处理。
存储扩充内容并满足代理检索条件的索引。
使用前面的对象驱动索引和扩充管道的索引器。

生成的索引 器符合 OneLake 索引器，其先决条件、支持的任务、支持的文档格式、支持的快捷方式和限制也适用于 OneLake 知识源。有关详细信息，请参阅 OneLake 索引器文档。

使用支持

Azure 门户	Microsoft Foundry 门户	.NET SDK	Python SDK	Java SDK	JavaScript SDK	REST API
✔️	✔️	✔️	✔️	✔️	✔️	✔️

先决条件

在提供代理检索的任何区域，使用 Azure AI 搜索。
完成 OneLake 索引器先决条件。
完成 OneLake 索引器数据准备。
在Azure AI 搜索上创建和使用对象的权限。我们建议使用基于角色的访问，但如果角色分配不可行，则可以使用 API 密钥。有关详细信息，请参阅 “连接到搜索服务”。

必需Azure.Search.Documents 包：
- 对于 2025-11-01-preview 功能，最新的预览包：dotnet add package Azure.Search.Documents --prerelease
- 关于2026-04-01的功能，最新的稳定包是：dotnet add package Azure.Search.Documents

所需的 azure-search-documents 包：
- 对于 2025-11-01-preview 功能，最新的预览包： pip install azure-search-documents --pre
- 对于 2026-04-01 的特性，最新的稳定包：pip install azure-search-documents

所需的 REST API 版本：
- 对于预览功能： Search Service 2025-11-01-preview
- 一般可用的功能：搜索服务 2026-04-01

检查现有知识源

知识源是顶级可重用对象。了解现有知识源有助于重复使用或命名新对象。

运行以下代码，按名称和类型列出知识源。

// List knowledge sources by name and type
using Azure.Search.Documents.Indexes;

var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);
var knowledgeSources = indexClient.GetKnowledgeSourcesAsync();

Console.WriteLine("Knowledge Sources:");

await foreach (var ks in knowledgeSources)
{
    Console.WriteLine($"  Name: {ks.Name}, Type: {ks.GetType().Name}");
}

名字	描述	类型	可编辑的	必填
`Name`	知识源的名称，该名称在知识源集合中必须唯一，并遵循Azure AI 搜索中对象的命名准则。	字符串	不	是的
`Description`	知识源的说明。	字符串	是的	不
`EncryptionKey`	客户管理的密钥，用于加密知识源和生成的对象中的敏感信息。	对象	是的	不
`IndexedOneLakeKnowledgeSourceParameters`	特定于 OneLake 知识源的参数： `FabricWorkspaceId`、 `LakehouseId`和 `TargetPath`。	对象		是的
`FabricWorkspaceId`	包含 Lakehouse 的工作区的 GUID。	字符串	不	是的
`LakehouseId`	湖屋的 GUID。	字符串	不	是的
`TargetPath`	Lakehouse 中的文件夹或快捷方式。未指定时，将对整个湖仓进行索引。	字符串	不	不

名字	描述	类型	可编辑的	必填
`Identity`	在生成的索引器中使用的托管标识。	对象	是的	不
`DisableImageVerbalization`	启用或禁用图像描述功能。默认值为`False`启用图像描述功能。将`True`设置为禁用图像描述功能。	布尔	不	不
`ChatCompletionModel`	一个聊天完成模型，用于口头处理图像或提取内容。支持的模型包括`gpt-4o`、`gpt-4o-mini`、、`gpt-4.1`、`gpt-4.1-minigpt-4.1-nano`、`gpt-5`、 `gpt-5-mini`和`gpt-5-nano`。 GenAI 提示技能包含在生成的技能集中。设置此参数还需要 `DisableImageVerbalization` 设置为 `False`.	对象	仅 `ApiKey` 和 `DeploymentName` 可编辑	不
`EmbeddingModel`	一个文本嵌入模型，用于在索引编制和查询时向量文本和图像内容。支持的模型是 `text-embedding-ada-002`， `text-embedding-3-small`以及 `text-embedding-3-large`。 Azure OpenAI 嵌入技能包含在生成的技能集中，Azure OpenAI 向量器包含在生成的索引中。	对象	仅 `ApiKey` 和 `DeploymentName` 可编辑	不
`ContentExtractionMode`	控制如何从文件中提取内容。默认值为 `minimal`：对文本和图像使用标准内容提取。设置为 `standard`，以便使用生成的技能集中的 Azure 内容理解技能进行高级文档破解和分块。仅针对`standard`，可以指定`AiServices`参数。	字符串	不	不
`AiServices`	Microsoft Foundry 资源，用于在 Foundry 工具中访问 Azure 内容理解。设置此参数需要 `ContentExtractionMode` 设置为 `standard`.	对象	仅 `ApiKey` 可编辑	不
`IngestionSchedule`	将计划信息添加到生成的索引器。还可以稍后添加计划以自动执行数据刷新。	对象	是的	不
`IngestionPermissionOptions`	用于与内容一起导入的文档级权限。指定`UserIds`或`GroupIdsRbacScope`存储索引中的权限元数据。有关特定于源的指南，请参阅从 Blob 存储引入 RBAC 权限和从 ADLS Gen2 引入 ACL 的。若要在查询时强制实施这些权限，请参阅在查询时强制实施权限。	阵列	不	不

创建索引的 OneLake 知识源

使用支持

先决条件

检查现有知识源

创建知识源

特定于源的属性

引入参数属性

检查摄取状态

查看创建的对象

分配给知识库

删除知识源

相关内容

反馈

其他资源