数据lakehouse架构:砖的良好的框架

这组数据lakehouse架构文章提供了原则和最佳实践的实现和操作lakehouse使用砖。

lakehouse砖上的良好的框架

良好的框架:数据lakehouse图。

lakehouse架构完善由7根柱子组成,描述不同领域关心的实现数据在云中lakehouse:

  • 数据治理

    监督,确保数据带来价值,支持您的业务策略。

  • 互操作性和可用性

    lakehouse的能力与用户和其他系统进行交互。

  • 卓越运营

    所有操作过程保持lakehouse运行在生产。

  • 安全,隐私,合规

    保护砖的应用程序,客户工作负载和客户数据的威胁。

  • 可靠性

    一个系统从故障中恢复的能力,继续函数。

  • 性能效率

    系统的能力,以适应负载的变化。

  • 成本优化

    管理成本交付的价值最大化。

lakehouse架构完善扩展了谷歌云架构框架砖Lakehouse平台和股票的支柱”bob体育客户端下载卓越运营”、“安全、隐私和遵从性”、“可靠性”、“性能优化“(”性能效率”)和“成本优化”。

对于这些五根柱子,云的原则和最佳实践框架lakehouse仍然适用。的lakehouse架构完善扩展这些原则和最佳实践的特定lakehouse和重要的建立一个有效和高效的lakehouse。

数据治理和互操作性和可用性在lakehouse架构

支柱”数据治理”和“互操作性和可用性“盖担忧lakehouse所特有的。

数据治理封装了实现安全管理的政策和实践数据资产在一个组织。的一个基本方面lakehouse集中式数据治理:lakehouse结合数据仓库和AI用例在单一平台。bob体育客户端下载这简化了现代数据堆栈通过消除数据孤岛,传统上单独的和复杂的数据工程,分析,BI,数据科学和机器学习。为了简化数据治理,lakehouse为数据提供了一个统一的治理解决方案,分析和人工智能。通过最小化数据的拷贝和移动到一个数据处理层,你所有的数据治理控制可以一起运行,提高你的机会呆在遵从性和检测数据泄露。

lakehouse的另一个重要原则是提供一个良好的用户体验的所有角色的工作,并且能够与多种生态系统的外部系统交互。谷歌云已经有各种各样的数据工具,数据驱动的企业可能需要执行大部分任务。然而,这些工具必须正确装配提供的所有功能,与每个服务提供不同的用户体验。这种方法会导致实现成本高和通常不提供相同的用户体验作为一个本地lakehouse平台:用户是有限的工具之间的不一致性和缺乏协作能力,通常需要经过复杂的过程访问系统,从而数据。bob体育客户端下载

一个集成lakehouse另一方面提供了一致的用户体验所有工作负载,因此增加了可用性。这样可以减少培训和新员工培训成本和改善之间的协作功能。此外,新特性是随时间自动添加进一步改善用户体验,而不需要投资内部资源和预算。

multicloud方法可以是一个深思熟虑的战略的公司合并和收购的结果或独立业务单位选择不同的云服务提供商。在这种情况下,使用一个multicloud lakehouse结果在所有云在一个统一的用户体验。这降低了整个企业系统的扩散,从而减少员工的技能和培训要求参与数据驱动的任务。

最后,在网络世界跨公司业务流程,系统必须尽可能无缝地协同工作。互操作性的程度是一个重要的标准,和最近的数据,作为核心资产的任何业务,必须在内部和外部合作伙伴之间安全地流系统。bob体育外网下载