砖Lakehouse迁移您的企业数据仓库

本文描述的一些注意事项和警告你需要考虑与砖Lakehouse取代您的企业数据仓库。大多数工作负载、查询和仪表板中定义数据仓库可以以最小的运行代码重构一旦管理员完成了初始数据迁移和治理配置。将数据仓库工作负载迁移到砖不是关于消除数据仓库,而是统一数据的生态系统。

许多Apache火花工作负载提取、转换和加载(ETL)数据从源系统到数据仓库下游分析。取代你的数据仓库lakehouse使分析师、数据科学家,对相同的表和数据工程师工作在同一个平台,减少整体复杂性,维护需求和总体拥有成本。bob体育客户端下载看到砖Lakehouse是什么?

数据加载到lakehouse

砖提供了大量的工具和功能,使它容易迁移数据到lakehouse和配置ETL作业加载来自不同数据源的数据。下面的文章介绍这些工具和选项:

如何砖Lakehouse不同数据仓库吗?

砖Lakehouse之上的Apache火花,统一编目,三角洲湖,提供本地支持大数据负载的分析,毫升和数据工程。所有企业数据系统略有不同事务担保,索引和优化模式和SQL语法。你可能会发现一些最大的差异包括以下:

  • 所有交易都是表级。没有数据库级的事务,锁,或担保。

  • 没有开始结束结构,这意味着每个语句或查询运行作为一个单独的事务中。

  • 三层命名空间使用catalog.schema.table模式。条款数据库模式由于遗产是同义的Apache火花语法。

  • 主键和外键约束信息。表级约束只能执行。看到约束砖

  • 本地数据类型支持砖从源系统和三角洲湖可能略有不同。前要注明所需精度的数值类型选择目标类型。

以下文章提供额外上下文添加重要的注意事项: