跳转到主要内容

研究

Lakehouse:新一代的开放式平台,统一数据仓库和先进的分析bob体育客户端下载

作者:迈克尔Armbrust Ali Ghodsi雷诺新马泰Zaharia

文摘

本文认为,数据仓库架构正如今天我们所知道的那样将在未来几年枯萎,取而代之的是一个新的体系结构模式,Lakehouse,将(i)是基于开放直接访问数据格式,例如Apache拼花,(ii)一流的对机器学习和数据科学的支持,和(3)提供先进的性能。Lakehouses可以帮助解决几个重大挑战与数据仓库,包括数据过时、可靠性、所有权的总成本、数据锁定,用例支持有限。我们将讨论如何行业已经朝着Lakehouses以及这种转变如何可能影响数据管理工作。我们也从Lakehouse系统报告结果使用拼花与流行的云数据仓库在TPC-DS具有竞争力。