数据共享

回到术语表

什么是数据共享?

数据共享是将相同的数据提供给一个或多个消费者的能力。如今,不断增长的数据量已经成为任何公司的战略资产。在您的组织内部或外部共享数据是一种使能技术寻找新的商业机会。共享数据以及从外部来源消费数据允许与合作伙伴合作,建立新的合作伙伴关系,并通过数据货币化产生新的收入流。bob体育外网下载

传统数据共享技术

首先,有诸如SFTP (SSH文件传输协议)或云对象存储等技术,可以实现自主开发的解决方案。但是,SFTP不能很好地扩展到大量的客户端,并且只能提供卸载到FTP服务器上的文件。使用预签名的对象存储url共享数据可以扩展到对象存储云服务的带宽,但只适用于一个特定的云供应商。

商业/闭源数据共享产品

其次,有一些数据共享解决方案被嵌入到供应商的产品中,如Oracle、AWS Redshift或Snowflake。这些解决方案在一个产品中使用很方便,它们共享表而不是文件,但它们不是开放的,因此不允许与不同的平台共享数据。bob体育客户端下载

bob下载地址开源的现代数据共享解决方案

bob下载地址基于开源的解决方案消除了商业解决方案的局限,并带来了许多额外的好处,例如社区开发的与流行的开源数据处理框架的集成。此外,开放协议允许轻松集成商业客户端,如BI工具。

三角洲分享

Delta Sharing是世界上第一个用于安全数据共享的开放协议,使得与其他组织共享数据变得简单,无论他们使用哪种计算平台。bob体育客户端下载
  • 实时数据直接共享-轻松共享Delta Lake中现有的实时数据,无需将其复制到另一个系统。
  • 〇支持多种客户端数据接收者可以直接从Pandas、Apache Spark™、Rust和其他系统连接到Delta Shares,而无需首先部署特定的计算平台。bob体育客户端下载减少将数据传递给用户的阻力。
  • 〇安全和治理Delta Sharing允许您轻松地管理、跟踪和审计对共享数据集的访问。
  • 可伸缩性——通过利用S3、ADLS和GCS等云存储系统,可靠有效地共享大规模数据集。

数据库上的Delta共享

Databricks本机集成了德尔塔共享在我们统一目录,为在组织内部和跨组织共享数据提供了简化的体验。管理员可以使用新的CREATE SHARE SQL命令或REST api管理共享,并集中审计所有访问。然后,接收方可以使用来自任何云上任何平台的数据。bob体育客户端下载

数据库上的Delta共享

三角洲共享:开放的生态系统

由开源和商业合作伙伴组成的三角洲共享生态系统每天都在增长。bob下载地址bob体育外网下载轻松地与任何人共享数据,无论在哪里。

三角洲共享:开放的生态系统

BOB低频彩在Databricks上了解更多关于数据共享的信息

报名加入Databricks Delta Sharing等待列表,以获得预览访问和更新。

额外的资源


回到术语表