Azure Databricks のスキーマとは

Unity Catalog では、スキーマは catalog の子であり、テーブル、ビュー、ボリューム、モデル、関数を含めることができます。 スキーマは、カタログよりも詳細なカテゴリのデータ編成を提供します。

このページでは、Unity カタログの Azure Databricks データ オブジェクト階層におけるスキーマの役割について説明します。

従来のワークスペースローカル Hive メタストアのスキーマについては、従来の Hive メタストアの Database オブジェクトに関する記事を参照してください。

スキーマとは

Unity カタログでは、スキーマは Unity カタログの 3 レベル名前空間 (catalog.schema.table-etc) の第 2 レベルです。

スキーマに焦点を当てた Unity Catalog オブジェクト モデル図

スキーマは、データと AI 資産を、カタログよりも詳細な論理カテゴリに整理します。 通常、スキーマは単一のユース ケース、プロジェクト、またはチーム サンドボックスを表します。 スキーマは、カテゴリの種類に関係なく、データ アクセス制御の管理とデータ検出の向上に役立つツールです。

Azure Databricks では、スキーマはデータベースと呼ばれることもあります。 たとえば、CREATE DATABASECREATE SCHEMA のエイリアスです。 この用語は、データベースがスキーマのコレクションである一部のリレーショナル データベース システムとは異なります。

すべての Unity カタログ カタログには、カタログのオブジェクトを記述する読み取り専用メタデータ ビューのシステム提供のスキーマである INFORMATION_SCHEMAが自動的に含まれます。 ユーザーが作成したスキーマとは別であり、名前は予約されています。 「情報スキーマ」を参照してください。

Unity Catalog 内のデータ オブジェクト階層の詳細については、「Azure Databricks のデータベース オブジェクトとは」を参照してください。

スキーマの管理された場所

Unity Catalog では、スキーマのマネージド ストレージの場所を指定することで、スキーマ内のすべてのマネージド テーブルとマネージド ボリュームのデータをカタログ内の他のスキーマのデータから物理的に分離できます。 これは完全に省略可能です。 スキーマのマネージド ストレージの場所を指定しない場合、データはカタログのマネージド ストレージの場所に存在します (カタログに定義されていない場合は、メタストアのマネージド ストレージの場所に存在します)。 「Unity Catalog の管理されたストレージの場所の指定」を参照してください。

外部テーブルとボリュームのデータ分離は、クラウド ストレージ内のデータを管理する方法によって異なります。 スキーマの管理場所とは無関係です。

次のステップ