使用Delta共享访问与您共享的数据

本文介绍如何使用Delta Sharing访问与您共享的数据。

共享和数据接收方

Delta Sharing是安全数据共享的开放标准。Databricks用户,称为数据提供商,可以使用Delta Sharing与他们组织之外的个人或组共享数据数据接收方

数据对数据的共享和开放共享

如何访问数据取决于您自己是否是Databricks用户,以及您的数据提供商是否配置了与您共享的数据Databricks-to-Databricks共享或公开分享

在数据库对数据库模型中,您必须是已启用的Databricks工作区的用户统一目录.您的团队成员为数据提供者提供Databricks工作区的唯一标识符,数据提供者使用该标识符创建安全的共享连接。共享数据只需在您的工作区中访问即可。如果有必要,您的团队成员可以对该数据配置粒度访问控制。

在开放共享模式中,您可以使用任何您喜欢的工具(包括Databricks)来访问共享数据。数据提供者通过安全通道向您发送一个激活URL。您可以按照它下载一个凭据文件,该文件允许您访问与您共享的数据。

使用条款

共享数据不是由Databricks直接提供,而是由运行在Databricks上的数据提供者提供。

请注意

通过作为数据接收方访问数据提供商的共享数据,数据接收方表示其已被授权访问数据提供商提供给其的数据共享,并承认(1)Databricks对该等数据或数据接收方对该等共享数据的使用不承担任何责任。和(2)数据库可收集有关数据接收者使用和访问共享数据的信息(包括识别使用与此类信息相关的凭据文件访问数据的任何个人或公司),并可与适用的数据提供商共享这些信息。

访问与您共享的数据

如何访问数据取决于您的数据提供者是使用开放共享协议还是使用databicks -to- databricks共享协议与您共享数据。看到数据对数据的共享和开放共享

访问databicks -to- databricks模型

在数据库对数据库模型中:

  1. 的惟一标识符,数据提供程序将向您发送指示统一目录metastore与你的Databricks工作空间相关联,然后你把它发送给他们。

    共享标识符是一个字符串,由metastore的云、区域和UUID (metastore的唯一标识符)组成,格式如下<云>:<地区>:< uuid >.例如,aws:一来:b0c978c8 - 3 - e68 - 4 -提供- 94 - af - d05c120ed1ef

    使用数据资源管理器获取共享标识符:

    1. 在Databricks工作区中,单击数据图标数据

    2. 在左窗格中,展开三角洲分享菜单和选择与我分享

    3. 在Providers选项卡上方,单击共享标识符复制图标。

    要使用notebook或Databricks SQL查询获取共享标识符,请使用默认SQL函数CURRENT_METASTORE.如果你使用笔记本电脑,它必须运行在一个Unity-Catalog-capable集群在您将用于访问共享数据的工作区中。

    选择CURRENT_METASTORE();
  2. 数据提供者创建:

    • 一个收件人在Databricks帐户中,以代表您和组织中将访问数据的用户。

    • 一个分享,这是要与您共享的表和视图的表示。

  3. 您可以访问与您共享的数据。如果需要,您或团队中的人员可以为用户配置数据的粒度数据访问。

在开放共享模型中获得访问权

在开放共享模式下:

  1. 数据提供者创建:

    • 一个收件人在Databricks帐户中,以代表您和组织中将访问数据的用户。作为该配置的一部分,将生成令牌和凭据文件。

    • 一个分享,它表示要与您共享的表和分区。

  2. 数据提供者通过安全通道向您发送一个激活URL。您可以按照它下载一个凭据文件,该文件允许您访问与您共享的数据。

    重要的

    不要将激活链接分享给任何人。一个证书文件只能下载一次。如果在已下载凭据文件后再次访问激活链接,则下载证书文件按钮已禁用。

    如果在使用之前丢失了激活链接,请与数据提供商联系。

  3. 将凭据文件存储在安全的位置。

    不要与应该有权访问共享数据的用户组之外的任何人共享凭据文件。如果需要与组织中的其他人共享密码,Databricks建议使用密码管理器。

读取共享数据

如何读取使用Delta Sharing与您安全共享的数据取决于您是否收到了凭据文件(开放共享模型),或者您正在使用Databricks工作区,并且您向数据提供者提供了您的共享标识符(Databricks-to-Databricks模型)。

使用凭证文件读取共享数据(开放共享)

如果使用Delta Sharing开放共享协议与您共享数据,则使用下载的凭据文件对数据提供者的Databricks帐户进行身份验证并读取共享数据。访问一直持续到提供者停止与您共享数据为止。数据的更新几乎是实时的。您可以读取和复制共享数据,但不能修改源数据。

在Databricks、Apache Spark、pandas和Power BI中使用凭据文件访问和读取共享数据,请参见读取使用Delta Sharing开放共享的数据

使用databicks -to- databricks共享方式读取共享数据

如果使用databicks -to- databricks模型与您共享数据,则访问共享数据不需要凭据文件。Databricks负责安全连接,在Databricks工作空间中自动发现共享数据。

若要了解如何在Databricks工作区中查找、读取和管理共享数据,请参见读取使用databicks -to- databricks Delta Sharing共享的数据

审计共享数据的使用情况

如果您可以访问Databricks工作区,则可以使用Databricks审计日志来了解组织中的谁正在使用Delta Sharing访问哪些数据。看到使用增量共享(针对收件人)审计和监视数据访问