跳转到主要内容
bob体育客户端下载平台的博客

宣布与统一编目数据沿袭的可用性

分享这篇文章

更新:数据沿袭现在一般可用在AWS和Azure。

我们兴奋地宣布数据沿袭统一目录,所有数据和人工智能的统一治理解决方案资产lakehouse,现在可以在预览。

这个博客将讨论数据沿袭的重要性,一些常见的用例,我们的愿景为更好的数据透明度和数据与数据沿袭和先睹为快的一些数据出处和我们建立治理功能。

数据沿袭和为什么它是重要的是什么?

数据沿袭了转换和细化的数据从源洞察力。家族包括捕捉所有相关的元数据和事件相关的数据在其生命周期,包括数据集的来源,其他数据集被用来创建它,谁创造了它,当转换进行了什么,哪些数据集利用它,和许多其他事件和属性。数据沿袭的解决方案,数据团队得到一个端到端视图的数据转换,以及它如何流经他们的数据。

随着越来越多的组织接受数据驱动的文化,建立过程和工具和艾城的民主化和规模数据,数据沿袭正在成为一个务实的数据管理的一个重要支柱和治理策略。

理解数据沿袭的重要性,强调了一些常见的用例我们听到了下面的我们的客户。

影响分析

经过多个更新或修改的数据在其生命周期,和理解任何数据变化的潜在影响下游消费者成为重要的从风险管理的角度来看。数据与数据沿袭,团队可以看到所有下游消费者——应用程序,仪表板,机器学习模型或数据集,等等——数据变化的影响,理解影响的严重程度,并通知相关的利益相关者。血统也帮助IT团队积极沟通数据迁移到合适的团队,确保业务连续性。

数据理解和透明度

组织处理来自多个数据源的数据的大量涌入,以及建立一个更好地理解周围环境的数据是至关重要的,以确保数据的可信度。数据沿袭领导人是一个强大的工具,使数据驱动更好的透明度和理解数据的组织。数据血统也使消费者如数据科学家,工程师和数据分析师是环境敏感,因为他们执行分析,导致质量更好的结果。最后,数据管理员可以看到哪些数据集不再访问或已经过时的退休不必要的数据,确保数据质量对最终业务用户。

调试和诊断

你可以拥有所有的制衡,但最终将打破。数据沿袭帮助数据团队执行任何错误的根源分析他们的数据管道、应用程序、仪表板、机器学习模型等,通过跟踪误差的来源。这大大减少了调试时间,保存几天,或者在许多情况下,几个月的手工工作。

合规和审计准备

许多合规规定,如一般的数据保护监管(GDPR),加州消费者隐私法案》(CCPA),健康保险流通与责任法案(hipaa),巴塞尔银行监管委员会(BCBS) 239年,萨班斯-奥克斯利法案(SOX),要求组织有清晰的理解和可见性的数据流。结果,数据可追溯性成为一个关键需求为了他们的数据架构,以满足法律法规。数据沿袭帮助组织兼容audit-ready,从而减轻了操作的开销手动创建数据流的跟踪审计报告的目的。

毫不费力的透明度和主动控制与数据沿袭

lakehouse提供了一种实用的数据管理体系结构,大大简化了企业数据通过统一的数据仓库基础设施和加速创新和AI用例在单一平台。bob体育客户端下载我们相信数据沿袭是更好的透明度和数据理解的关键推动者lakehouse,出现数据之间的关系,工作,和消费者,帮助组织朝着积极的数据管理实践。例如:

  • 仪表板的主人,你下次要通知表仪表板取决于不是正确加载?
  • 作为机器学习的医生开发一个模型,你要提醒你的模型的一个关键特性很快就会过时吗?
  • 作为一个治理管理,你想自动控制对数据的访问基于它的出处?

所有的这些功能依赖自动收集数据沿袭所有用例和角色——这就是为什么lakehouse和数据沿袭一个强大的组合。

这里有一些特性我们航运的预览:

数据沿袭表

表列数据沿袭

数据沿袭了笔记本、工作流、仪表板

  • 内置的安全:谱系图在统一目录privilege-aware和共享相同的权限模型统一目录。如果用户没有访问一个表,他们将无法探索相关的血统表,添加一个额外的安全层隐私方面的考虑。
  • 通过REST API很容易出口:可以可视化的血统数据浏览在接近实时检索通过REST API来支持集成合作伙伴与我们的目录。bob体育外网下载

开始使用在统一编目数据沿袭

数据沿袭可用砖溢价和企业层没有额外的成本。如果你已经是一个砖客户,按照数据沿袭指南(AWS|Azure)开始。如果你没有一个现有的砖客户,注册一个免费试用溢价或企业工作空间。

免费试着砖

相关的帖子

看到所有bob体育客户端下载平台的博客的帖子