最佳实践管理三角洲湖表

学习的最佳实践管理三角洲湖表。

写的亚当Pavlacka

去年发表在:2022年5月10日

无论你如何删除管理表,它可以花大量的时间,这取决于数据大小。三角洲湖管理表中特定的元数据包含许多事务日志的形式,和它们可以包含重复数据文件。如果δ表已经使用了很长时间,它可以积累大量的数据。

在砖环境中,有两种方法可以降低表(AWS|Azure|GCP):

  • 运行删除表笔记本电池。
  • 点击删除在UI中。

即使你在后台可以删除表而不影响工作负载,它总是好的,以确保你运行删除从(AWS|Azure|GCP),真空(AWS|Azure|GCP)在你开始下降之前命令在任何表。这确保元数据和文件大小是清理之前启动实际的数据删除。

例如,如果你想删除三角洲表事件在你开始之前,请运行以下命令删除表命令:

  1. 删除从运行:删除事件
  2. 真空运行的时间间隔为零:真空事件保持0小时

这两个步骤减少未提交文件的元数据和数量,否则增加的数据删除。

这篇文章有用吗?