数据治理

回到术语表

什么是数据治理?

数据治理是监督确保数据带来价值而且支持业务战略。数据治理不仅仅是一个工具或过程。它使用跨人员、流程、技术和数据的框架将与数据相关的需求与业务策略结合起来,重点关注文化,以支持业务目标和目标。

数据治理的业务利益是什么?

随着数据的数量和复杂性不断增长,越来越多的组织开始关注数据治理,以确保核心业务成果:
  • 一致性和高质量的数据是分析和机器学习的基础
  • 缩短洞察的时间
  • 支持HIPPA、FedRAMP、GDPR或CCPA等行业法规的风险和合规性。
  • 数据民主化,即使组织中的每个人都能做出数据驱动的决策
  • 成本优化,例如防止用户启动大型集群,并为使用昂贵的GPU实例创建护栏。

好的数据治理解决方案是什么样的?

数据驱动型公司通常在湖屋上构建数据架构进行分析。一个数据lakehouse是一种体系结构,可以直接对存储在数据湖中的大量数据进行高效、安全的数据工程、机器学习、数据仓库和商业智能。数据湖屋的数据治理提供了一些关键功能:
  • 统一目录:统一的目录存储所有数据、ML模型和分析工件,以及每个数据对象的元数据。统一的目录还混合了来自其他目录的数据,比如现有的Hive metastore。
  • 统一数据访问控制:跨所有数据资产和所有云的单一统一权限模型。这包括针对个人身份信息(PII)的基于属性的访问控制(ABAC)。
  • 数据审核:通过警报和监控功能对数据访问进行集中审计,以促进问责制。
  • 数据质量管理:强大的数据质量管理,内置质量控制、测试、监控和执行,以确保下游BI、分析和机器学习工作负载可获得准确和有用的数据
  • 数据沿袭:Data Lineage提供端到端可见性,了解数据在lakehouse中如何从源流向消费
  • 数据发现:轻松的数据发现使数据科学家、数据分析师和数据工程师能够快速发现和引用相关数据,并加快实现价值的时间
  • 数据共享:数据可以跨云和平台共享。bob体育客户端下载

数据管理和数据治理的区别是什么?

数据管理关注符合数据治理的活动策略、原则和标准交付可信数据.这样的活动通常以项目为中心,时间很短。数据治理被视为一个程序意识到长期的利益.集中式治理工具在治理的实现中起着关键作用。

BOB低频彩在Databricks上了解有关数据治理和数据共享的更多信息


回到术语表