研究

Lakehouse:统一数据仓库和高级分析的新一代开放平台bob体育客户端下载

作者:Michael Armbrust, Ali Ghodsi, reynolds Xin, Matei Zaharia

下载论文

摘要

本文认为,我们今天所知道的数据仓库架构将在未来几年内消亡,并被一种新的架构模式Lakehouse所取代,Lakehouse将(i)基于开放的直接访问数据格式,如Apache Parquet, (ii)对机器学习和数据科学有一流的支持,(iii)提供最先进的性能。lakehouse可以帮助解决数据仓库的几个主要挑战,包括数据陈旧、可靠性、总拥有成本、数据锁定和有限的用例支持。我们将讨论该行业是如何向lakehouse转移的,以及这种转变将如何影响数据管理工作。我们还报告了使用Parquet的Lakehouse系统的结果,该系统与TPC-DS上流行的云数据仓库具有竞争力。

相关内容

作者:Michael Armbrust, Tathagata Das,孙立文,Burak Yavuz,朱世雄,Mukul Murthy, Joseph Torres, Herman van Hovell, Adrian Ionescu, Alicja Łuszczak, michaola [Switakowski], michaola Szafra [nski], Xiao Li, Takuya Ueshin, Mostafa Mokhtar, Peter Boncz, Ali Ghodsi, Sameer Paranjpye, Pieter Senster, Reynold Xin, Matei Zaharia

作者:Michael Armbrust, Tathagata Das, Joseph Torres, Burak Yavuz,朱世雄,Reynold Xin, Ali Ghodsi, Ion Stoica, Matei Zaharia

作者:Shoumik Palkar, Firas Abuzaid, Peter Bailis, Matei Zaharia

作者:Michael Armbrust, reynolds S. Xin,程莲,殷怀,Davies Liu, Joseph K. Bradley, Xiangrui孟,Tomer Kaftan, Michael J. Franklin, Ali Ghodsi, Matei Zaharia

作者:reynolds S. Xin, Josh Rosen, Matei Zaharia, Michael J. Franklin, Scott Shenker, Ion Stoica