共享数据安全地使用三角洲共享
本文介绍了δ分享数据砖,安全数据共享平台,让你在砖与用户共享数据以外的组织。bob体育客户端下载
三角洲分享关于这个网站的文章关注砖数据共享和笔记本。也可以作为一个三角洲共享开源项目你可以从其他平台使用分享三角洲表。bob体育客户端下载δ共享还提供了支柱砖的市场为交换数据产品,一个开放的论坛。
请注意
如果你是一个数据接收方通过三角洲被授予访问共享数据分享,和你只是想了解如何访问这些数据,看到了吗访问共享数据使用三角洲与你共享。
δ分享是什么?
三角洲分享是一个开放的协议由砖安全数据共享与其他组织无论他们所使用的计算平台。bob体育客户端下载砖建造的三角洲分享到其统一编目数据治理平台,使砖的用户,称为bob体育客户端下载数据提供商外,与一个人或一组共享数据的组织,叫做数据接收方。
三角洲的本机集成共享统一目录允许您管理、管理、审核和跟踪使用共享数据的一个平台。bob体育客户端下载事实上,你的数据必须在统一注册目录是用于安全共享。数据也必须的三角洲表格格式。
股票和接受者
主要的概念基础三角洲共享数据砖股票和收件人。
什么是股票?
在三角洲地区共享,分享是一个只读的表和表分区共享与一个或多个接受者。如果您的收件人使用统一Catalog-enabled砖工作区,你还可以包括笔记本共享中的文件。
分享是一个可获得的对象在统一注册目录。分享可以包含表和笔记本文件从一个目录metastore统一。您可以添加或删除表和笔记本文件从一个分享在任何时间,你可以指定或撤销数据接收方在任何时候访问共享。
如果你删除一个份额统一目录metastore,所有的人分享失去访问它的能力。
看到创建和管理股票三角洲共享。
开放共享和Databricks-to-Databricks共享
你使用三角洲共享的方式取决于你是谁共享数据:
公开分享让你与任何用户分享数据,是否获得砖。
Databricks-to-Databricks分享让你砖用户访问共享数据的统一目录metastore不同于你的。Databricks-to-Databricks还支持笔记本共享,这不是公开分享。
δ共享开放什么?
如果你想分享你的砖之外的数据与用户工作空间,无论他们使用砖,你可以使用开放δ分享分享你的数据安全。作为数据提供者,您生成一个令牌和收件人是安全地分享。他们使用令牌进行身份验证并获得读访问权的表你包含在股票给他们访问权。
收件人可以访问共享数据使用许多计算工具和平台,包括:bob体育客户端下载
砖
Apache火花
熊猫
权力BI
三角洲的完整列表共享连接器和如何使用它们的信息,看到了三角洲分享文档。
另请参阅共享数据使用三角洲共享开放共享协议。
Databricks-to-Databricks三角洲分享是什么?
如果你想分享数据和用户没有访问你的metastore统一目录,您可以使用Databricks-to-Databricks三角洲共享,只要收件人使用砖工作区为统一启用目录。Databricks-to-Databricks分享可以让你与其他用户共享数据砖账户,他们是否在AWS, Azure,或质量。这也是一个很好的方法来安全地共享数据在不同目录metastores统一在自己的砖。
这个场景的一个优点是,分享接收者不需要令牌访问份额,和提供者不需要管理接受者的令牌。共享的连接(包含所有的安全身份验证、身份验证和审计管理完全通过三角洲和砖平台共享。bob体育客户端下载另一个优势是能够分享砖笔记本文件。
管理员设置三角洲分享如何?
Databricks-to-Databricks统一目录metastores之间共享相同的账户总是启用。使三角洲与砖工作区共享共享数据在其他帐户或non-Databricks客户,砖账户管理员或metastore管理执行以下设置步骤(在一个高水平):
为统一启用三角洲共享目录metastore管理你想分享的数据。
创建一个共享metastore包括一个或多个表。
如果您计划使用Databricks-to-Databricks分享,您还可以添加笔记本文件共享。
看到创建和管理股票三角洲共享。
创建一个收件人。
如果收件人不是砖用户,或没有获得一个砖工作区为统一目录启用,您必须使用公开分享。一组口令生成凭证的接受者。
如果收件人访问砖的工作空间,为统一启用目录,您可以使用Databricks-to-Databricks分享,不需要基于符号的凭证。你的请求共享标识符从接受者和使用它来建立安全连接。
提示
利用自己作为测试接受者尝试安装过程。
授予接收者访问一个或多个股票。
请注意
这一步也可以由一个非管理用户的
使用分享
,使用收件人
和集分享许可
特权。看到统一目录权限和可获得的对象。把收件人的信息,他们需要连接到共享(仅开放共享)。
看到把收件人的连接信息。
开放共享,使用一条安全通道来发送收件人一个激活链接的口令,让他们下载证书。
对于Databricks-to-Databricks共享,数据包含在接收方的砖的工作区中可用份额只要你给他们访问共享。
收件人现在可以访问共享数据。
如何接受访问共享数据?
收件人访问共享只读格式的表。共享笔记本文件是只读的,但是他们可以被克隆,然后接收者的工作区中修改和运行就像任何其他笔记本。
安全访问取决于共享模型:
开放共享:收件人提供的凭据访问数据时选择的工具,包括Apache火花,大熊猫,BI,砖,和许多更多。看到读取数据共享使用三角洲共享开放共享。
使用砖Databricks-to-Databricks:收件人访问数据。他们可以使用统一目录格兰特和拒绝访问其他用户的砖。看到读取数据共享使用Databricks-to-Databricks三角洲共享。
每当数据提供商更新数据表在自己的砖,近乎实时的更新出现在收件人的系统。
你如何跟踪共享和访问共享数据是谁?
数据提供者可以使用砖审计日志监视股票和接受者的创建和修改,并可以监控接收活动的股票。看到审计和监测数据共享使用三角洲共享(供应商)。
受者使用共享数据在砖帐户可以使用砖审计日志记录的理解是谁访问数据。看到审计和监控数据访问使用三角洲共享(收件人)。
共享笔记本
您可以使用三角洲分享分享使用Databricks-to-Databricks共享笔记本文件流。看到笔记本文件添加到一个份额(供应商)读共享笔记本(收件人)。
三角洲共享和流
三角洲共享支持结构化流火花。提供者可以共享一个表与历史,以便接收方可以使用它作为一个结构化流源,与低延迟处理共享数据增量。收件人也可以执行三角洲湖时间旅行的查询与历史表上的共享。
学习如何分享与历史表,请参阅将表添加到一个份额。学习如何使用共享表流媒体来源,明白了查询一个表使用Apache火花结构化流(对于接受者Databricks-to-Databricks共享)或访问一个共享表使用火花结构化流开放共享数据(接受者)。
另请参阅流媒体在砖。
资源配额
下面的值表示δ共享资源的配额。
对象 |
父 |
价值 |
---|---|---|
提供者 |
metastore |
1000年 |
收件人 |
metastore |
5000年 |
股票 |
metastore |
1000年 |
表 |
分享 |
1000年 |
如果你期望超过这些资源限制,与你的砖账户代表联系。
下一个步骤
BOB低频彩了解更多的公开分享和Databricks-to-Databricks共享模型