Unity Catalog是一个统一的治理解决方案,适用于所有数据和人工智能资产,包括文件、表、机器学习模型和仪表板。
数据和人工智能的集中治理
内置数据搜索和发现
性能和规模
所有工作负载的自动沿袭
与您现有的工具集成

它是如何工作的
集中管理和治理所有数据资产
使用基于开放标准ANSI SQL的通用治理模型,可以简化任何云上的文件、表、仪表板和ML模型的治理。在帐户级别定义一次访问策略,并跨所有工作负载和工作空间强制执行。Unity Catalog还通过捕获针对数据执行的操作的审计日志来提供集中的细粒度审计,并帮助您满足合规性和审计需求。
管理细粒度的访问控制
使用标准SQL函数定义行筛选器和列掩码,允许对行和列进行细粒度访问控制。随着Databricks继续构建功能以提高可伸缩性和集成,即将推出的基于属性的访问控制将使您能够基于自定义标记(属性)定义访问策略。
统一安全的数据搜索体验
为数据分析师、数据工程师和数据科学家提供统一的数据搜索体验,快速查找、理解和引用来自整个数据域的相关数据。Unity Catalog中的数据搜索在默认情况下是安全的,根据用户的访问权限限制搜索结果,并为隐私考虑添加了额外的安全层。
增强了任意规模的查询性能
Unity Catalog通过低延迟元数据服务和表自动调优提供了增强的查询性能,从而在任何规模下更快地执行查询。异步自动数据压缩可以优化文件大小,并在后台自动减少输入/输出(I/O)延迟。
自动和实时数据沿袭
通过SQL、Python、Scala和r中的所有工作负载,通过自动和实时数据沿袭,获得端到端可见性,了解数据如何在您的湖屋中流动。快速执行数据质量检查,完成数据更改的影响分析,并调试数据管道中的任何错误。受益于跨表、列、笔记本、工作流和仪表板的沿袭。Unity Catalog中的沿袭图是特权感知的,基于用户的访问权限限制对沿袭图的访问。还可以通过REST API检索Lineage,以支持与其他目录的集成。
跨组织的数据共享安全
Unity目录本地支持三角洲分享,这是世界上第一个用于安全数据共享的开放协议,使您能够轻松地将Delta Lake和Apache Parquet格式的现有数据共享到任何计算平台。bob体育客户端下载消费者不需要使用Databricks平台、相同的云或任何云。bob体育客户端下载您可以共享实时数据,而无需将其复制或复制到另一个系统。与Power BI、Tableau、Spark、pandas和Java的本机集成允许接收方直接从他们选择的工具中使用共享数据。您可以在一个平台上集中管理、治理、审计和跟踪共享数据的使用情况。bob体育客户端下载
