Databricks数据科学与工程指南

Databricks数据科学与工程是数据科学家、数据工程师和数据分析师之间协作的经典Databricks环境。它也构成了Databricks机器学习环境

请注意

如果您是一名主要使用SQL查询和BI工具的数据分析师,您可能更喜欢砖的SQLpersona-based环境。

Databricks数据科学与工程指南提供了如何指导,以帮助您最大限度地利用Databricks协作分析平台。bob体育客户端下载有关入门教程和介绍性信息,请参见开始:免费试用和安装而且什么是数据库?

  • 结构化流

    学习如何使用Apache Spark Structured Streaming在Databricks中表示流数据的计算。

  • Delta活动表

    学习如何使用Databricks Delta Live Tables构建数据处理管道。

  • 运行时

    了解Databricks运行时的类型和运行时内容。

  • 集群

    了解Databricks集群以及如何创建和管理它们。

  • 笔记本电脑

    了解什么是Databricks笔记本,以及如何使用和管理笔记本来处理、分析和可视化数据。

  • 工作流

    在Databricks中学习如何使用数据处理工具和框架。

  • 在Databricks中学习如何使用和管理库。

  • 回购

    学习如何在Databricks中使用Git来版本控制您的笔记本电脑和其他文件。

  • DBFS

    了解Databricks文件系统(DBFS),这是一个挂载到Databricks工作空间中的分布式文件系统,可在Databricks集群上使用

  • 文件

    了解在Databricks上处理文件的选项。

  • 迁移

    了解如何将数据应用程序(如ETL作业、数据仓库、ML、数据科学和分析)迁移到Databricks。