Apache Spark™在过去几年中取得了巨大的增长,由于其速度快、易于使用和复杂的分析,它已成为当今企业中事实上的数据处理和AI引擎。Spark通过简化各种来源的大规模数据准备来统一数据和AI,为数据工程和数据科学工作负载提供一组一致的api,以及与流行的AI框架和库(如TensorFlow、PyTorch、R和SciKit-Learn)的无缝集成。
Databricks是由最初创建Apache Spark的团队创建的,很荣幸地分享Spark:权威指南一书的摘录。享受由Databricks提供的免费迷你电子书吧。
在这本电子书中,我们将介绍:
获取电子书以了解更多。BOB低频彩