电子书

释放数据的潜力

了解Apache Spark™和Delta Lake如何在一个BI和ML平台上统一您的所有数据(大数据和业务数据)。bob体育客户端下载

Apache Spark 3。x在易用性、更高的性能和更智能的跨Spark组件api统一方面是一个巨大的转变。对于正在处理的数据,Delta Lake为数据湖带来了数据可靠性和性能,具有ACID事务、模式强制、DML命令和时间旅行等功能。

在这本电子书中,我们提供了一步一步的技术内容和相关资产指南,将引导您学习Apache Spark和Delta Lake。无论您是刚刚开始还是已经是一个有成就的开发人员,都可以探索这些开源项目的好处。bob下载地址

下面是我们将要介绍的8个步骤:

  1. 为什么是Apache Spark和Delta Lake
  2. Apache Spark概念、关键术语和关键字
  3. 高级Apache Spark内部和核心
  4. 数据框架,数据集和Spark SQL要领
  5. 使用GraphFrames进行图形处理
  6. 具有结构化流的连续应用程序
  7. 人类的机器学习
  8. 可靠的数据湖和数据管道