使用镜像和虚拟化来简化数据管理
由于集成各种数据源、确保数据一致性和维护实时数据可用性的复杂性,组织在管理和分析数据方面经常面临挑战。 Microsoft Fabric SQL 数据库提供一个统一平台来简化数据集成、增强数据一致性并确保准实时数据可用性,从而解决这些挑战。
与镜像集成
Microsoft Fabric SQL 数据库的主要功能之一是能够将数据库从 Azure SQL 数据库直接镜像到 Fabric 的 OneLake 中。 此外,出于分析目的,Fabric 中的 SQL 数据库会自动镜像,数据几乎实时地连续复制到 OneLake 中。
此镜像过程可确保数据近乎实时地持续复制,而无需复杂的提取、转换、加载 (ETL) 过程。 通过这样做,它降低了总拥有成本并加快获得见解,使企业能够解锁商业智能、人工智能、数据工程、数据科学和数据共享方案。
启动镜像过程后,可以从“复制”选项卡中选择“监视复制”选项来监视复制状态。如果源表中没有更新,引擎将暂停并在检测到更新的数据后恢复定期轮询。
若要详细了解如何配置镜像数据库,请参阅教程:从 Azure SQL 数据库配置 Microsoft Fabric 镜像数据库。
探索数据虚拟化
Fabric SQL 数据库中的数据虚拟化是一项功能,可用于访问和操作来自各种源的数据,而无需以物理方式移动或复制数据。 此方法提供统一的数据视图,可实现跨不同平台的无缝集成和分析。
这些功能支持查询湖屋中可用的 Parquet、CSV 和 Delta 表等方案。
| 功能 | 定义 | 查询示例 |
|---|---|---|
| 数据库范围的凭据 | 允许创建可用于安全访问外部数据源的凭据。 | CREATE DATABASE SCOPED CREDENTIAL MyCredential WITH IDENTITY = 'USER IDENTITY'; |
| 外部数据源 | 这使你能够定义外部数据源,例如存储在 OneLake 中的文件。 | 'abfss://aaaaaaaa-0000-1111-2222-bbbbbbbbbbbb@<onelake_account_name>.dfs.fabric.microsoft.com/bbbbbbbb-1111-2222-3333-cccccccccccc/Files/parquet/data1.parquet'; |
| 外部文件格式 | 通过此功能可指定外部文件的格式,例如 Parquet、CSV 和 Delta 文件。 | CREATE EXTERNAL FILE FORMAT MyFileFormat WITH ( FORMAT_TYPE = DELIMITEDTEXT, FORMAT_OPTIONS ( FIELD_TERMINATOR = ',', STRING_DELIMITER = '"' ) ); |
| 外部表 | 这样,可以创建表来引用存储在 SQL 数据库外部的数据。 | CREATE EXTERNAL TABLE MyExternalTable ( Column1 INT, Column2 NVARCHAR(50) ) WITH ( LOCATION = 'myfolder/myfile.csv', DATA_SOURCE = MyExternalDataSource, FILE_FORMAT = MyFileFormat ); |