数据共享

免费试用Databricks

什么是数据共享?

数据共享是将相同的数据提供给一个或多个消费者的能力。如今,不断增长的数据量已成为任何公司的战略资产。共享数据—在组织内部或外部—是一种技术使能技术寻找新的商业机会。共享数据以及使用来自外部来源的数据允许与合作伙伴合作,建立新的合作伙伴关系,并通过数据货币化产生新的收入流。bob体育外网下载

传统数据共享技术

首先,有诸如SFTP (SSH文件传输协议)或云对象存储之类的技术,这些技术允许实现自己开发的解决方案。但是,SFTP不能很好地扩展到大量客户端,并且只提供卸载到FTP服务器的文件。使用预先签名的对象存储url来共享数据可以扩展到对象存储云服务的带宽,但只适用于一个特定的云供应商。

商业/闭源数据共享产品

其次,有数据共享解决方案嵌入到供应商的产品中,如Oracle、AWS Redshift或Snowflake。这些解决方案便于在产品中使用,它们共享表而不是文件,但它们不是打开的,因此不允许与不同的平台共享数据。bob体育客户端下载

bob下载地址开源的现代数据共享解决方案

bob下载地址基于开源的解决方案消除了商业解决方案的束缚,并带来了许多额外的好处,例如社区开发的与流行的开源数据处理框架的集成。此外,开放协议允许轻松集成商业客户端,例如BI工具。

三角洲分享

Delta Sharing是世界上第一个用于安全数据共享的开放协议,使得与其他组织共享数据变得简单,无论他们使用哪种计算平台。bob体育客户端下载

  • 直接共享实时数据轻松共享Delta Lake中现有的实时数据,而无需将其复制到另一个系统。
  • 〇支持多样化的客户数据接收方可以直接从Pandas、Apache Spark™、Rust和其他系统连接到Delta Shares,而无需首先部署特定的计算平台。bob体育客户端下载减少向用户提供数据的摩擦。
  • 〇安全管理Delta Sharing允许您轻松地管理、跟踪和审计对共享数据集的访问。
  • 可伸缩性——通过利用S3、ADLS和GCS等云存储系统,可靠、高效地共享大规模数据集。

数据块上的Delta共享

Databricks原生集成了Delta共享统一目录,为组织内部和跨组织共享数据提供了简化的体验。管理员可以使用新的CREATE SHARE SQL命令或REST接口管理共享,并集中审计所有访问。然后,接收者可以从任何云上的任何平台使用数据。bob体育客户端下载

数据块上的Delta共享

三角洲共享:一个开放的生态系统

由开源和商业合作伙伴组成的Delta共享生态系统每天都在成长。bob下载地址bob体育外网下载轻松地与任何人共享数据,无论在哪里。

三角洲共享:开放的生态系统

BOB低频彩在Databricks上了解更多关于数据共享的信息

报名加入Databricks Delta共享等候名单,以获得预览访问和更新。

额外的资源

返回术语表