Lakehouse:统一数据仓库和高级分析的新一代开放平台bob体育客户端下载
摘要
本文认为,我们今天所知道的数据仓库架构将在未来几年内消亡,并被一种新的架构模式Lakehouse所取代,Lakehouse将(i)基于开放的直接访问数据格式,如Apache Parquet, (ii)对机器学习和数据科学有一流的支持,(iii)提供最先进的性能。lakehouse可以帮助解决数据仓库的几个主要挑战,包括数据陈旧、可靠性、总拥有成本、数据锁定和有限的用例支持。我们将讨论该行业是如何向lakehouse转移的,以及这种转变将如何影响数据管理工作。我们还报告了使用Parquet的Lakehouse系统的结果,该系统与TPC-DS上流行的云数据仓库具有竞争力。