创建一个Unity Catalog metastore

这篇文章展示了如何在Unity Catalog中创建一个metastore,并将其链接到工作区。

请注意

除了本文中描述的方法外,还可以使用Databricks Terraform提供商,特别是databricks_metastore资源。要使Unity Catalog能够访问metastore,请使用databricks_metastore_data_access.要将工作区链接到metastore,请使用databricks_metastore_assignment

需求

创建亚转移

要创建一个Unity Catalog metastore:

  1. 在AWS中配置存储桶和IAM角色。

    存储桶是metastore的元数据和管理表将被存储。它必须与要用于访问数据的工作空间位于同一区域。它可以在目录和模式级别被重写。

    为您创建的每个metastore使用一个专用的S3桶。

    Databricks通过IAM角色对存储桶进行访问。

    有关说明,请参见在AWS中配置存储桶和IAM角色

    注意S3桶路径,以s3: / /, IAM角色ARN。

  2. 登录数据库账户控制台

  3. 点击数据图标数据

  4. 点击创建Metastore

    1. 输入metastore的名称。

    2. 进入将部署亚转移瘤的区域。

      这必须与要用于访问数据的工作区相同。确保它与前面创建的云存储桶的区域相匹配。

    3. 输入S3桶路径(可以省略s3: / /)和步骤1中创建的IAM角色名。

  5. 点击创建

  6. 当出现提示时,选择要链接到metastore的工作区。

    有关将工作区链接到亚metastore的更多信息,请参见为Unity Catalog启用一个工作区

创建metastore的用户是其原始的metastore管理员。Databricks建议将原来的metastore管理员重新分配给一个组。看到(推荐)转移你的metastore的所有权到一个组

为个人暂存位置启用Databricks管理

Databricks使用跨源资源共享(CORS)将数据上传到Unity Catalog中的个人暂存位置。看到为CORS配置Unity Catalog存储帐户

删除一个metastore

如果您正在关闭Databricks帐户或有其他原因要删除对Unity Catalog metastore管理的数据的访问权限,您可以删除该metastore。

警告

通过使用Databricks工作空间,metastore管理的所有对象都将变得不可访问。此操作无法撤消。

管理表数据和元数据将在30天后自动删除。云存储中的外部表数据不受metastore删除的影响。

删除一个metastore:

  1. 以metastore管理员身份登录账户控制台

  2. 点击数据图标数据

  3. 单击metastore名称。

  4. 配置选项卡,单击右上方的三键菜单,选择删除

  5. 在确认对话框中,输入metastore的名称并单击删除