Apache Spark™Under the Hood

从核心架构和基本概念开始

Apache Spark™Under the Hood

Apache Spark™在过去几年中取得了巨大的增长,由于其速度快、易于使用和复杂的分析,它已成为当今企业中事实上的数据处理和AI引擎。Spark通过简化各种来源的大规模数据准备来统一数据和AI,为数据工程和数据科学工作负载提供一组一致的api,以及与流行的AI框架和库(如TensorFlow、PyTorch、R和SciKit-Learn)的无缝集成。

Databricks是由最初创建Apache Spark的团队创建的,很荣幸地分享Spark:权威指南一书的摘录。享受由Databricks提供的免费迷你电子书吧。

在这本电子书中,我们将介绍:

  • Apache Spark的过去、现在和未来。
  • 自行安装和运行Spark的基本步骤。
  • Spark核心架构和概念的总结。
  • Spark强大的语言api以及如何使用它们。

获取电子书以了解更多。BOB低频彩