数据治理的最佳实践

本文描述了数据治理的必要性和分享最佳实践和策略可以使用在整个组织中实施这些技术。

数据治理为什么重要?

数据治理是监督,以确保数据带来价值和支持您的业务策略。数据治理封装了实现安全管理的政策和实践数据资产在一个组织。随着数据量和复杂性的增长,越来越多的组织正在考虑数据治理,确保核心业务成果:

  • 一致的和高数据质量分析和机器学习的基础。

  • 减少时间洞察力。

  • 数据民主化,使每个人都在一个组织数据驱动决策。

  • 支持行业监管和合规风险如HIPAA、FedRAMP, GDPR或CCPA。

  • 成本优化,例如通过阻止用户启动大型集群和创建护栏使用昂贵的GPU实例。

一个好的数据治理解决方案看起来像什么?

数据驱动的公司通常在lakehouse建立数据体系结构分析。数据lakehouse是一个架构,实现高效、安全的数据工程,机器学习,数据仓库和业务智能直接在大量的数据存储在数据湖泊。数据治理的数据lakehouse提供了以下主要功能:

  • 统一目录:一个统一的目录存储所有数据,毫升模型,和分析工件,除了为每个数据对象的元数据。统一目录也融入数据从现有的蜂巢metastore等其他目录。

  • 统一数据访问控制:单一和统一权限模型在所有数据资产和所有云。这包括基于属性的访问控制(ABAC)个人身份信息(PII)。

  • 数据隔离:数据隔离可以实现多个levels-environment,存储位置,数据对象增加granularity-without失去集中管理访问和审计的能力。

  • 数据审核:数据访问与警报和监视功能集中审计,促进问责制。

  • 数据质量管理:健壮的内置数据质量管理与质量控制、测试、监控、和执行,以确保准确和有用的数据用于下游BI,分析和机器学习的工作负载。

  • 数据沿袭:数据沿袭,端到端可见性数据流从源lakehouse如何消费。

  • 数据发现:简单的数据发现,使数据科学家,数据分析师和数据工程师很快发现和参考相关数据和加速的时间价值。

  • 数据共享:数据可以跨云层和共享平台。bob体育客户端下载

数据治理和砖

砖提供了数据的集中式控制和人工智能的统一目录和三角洲共享。

  • 统一目录是一个细粒度的数据治理解决方案和砖Lakehouse AI。它有助于简化数据的安全性和治理提供一个中心位置管理和审计数据访问。

  • 三角洲分享是一个开放的协议由砖安全数据共享与其他组织,或与组织中其他的团队,无论他们所使用的计算平台。bob体育客户端下载

对采用统一目录和δ分享最佳实践,明白了统一目录的最佳实践

遗留数据治理解决方案

  • 访问控制表是一个遗留数据治理模型,允许您以编程方式grant和revoke访问对象由工作区中内置的蜂巢metastore管理。砖建议您使用统一目录而不是表的访问控制。统一目录简化了数据的安全性和治理提供一个中心位置管理和审计数据访问跨多个工作空间在您的帐户。

身份配置

每一个优秀的数据治理的故事开始于一个强大的身份的基础。学习如何最好地配置身份在砖,明白了身份的最佳实践

BOB低频彩

这里有一些资源来帮助您构建一个全面的数据管理解决方案,满足您的组织的需要:

  • 开始使用统一目录,一步一步的指示设置统一目录为您的组织。

  • 砖安全和信任中心,它提供了信息安全的方式是每层砖Lakehouse平台。bob体育客户端下载

  • 保密管理,信息如何使用砖秘密存储凭证和参考他们的笔记本电脑和工作。千万不要硬编码秘密或者存储在纯文本。