Databricks数据科学与工程指南
Databricks数据科学与工程是数据科学家、数据工程师和数据分析师之间协作的经典Databricks环境。它也构成了Databricks机器学习环境.
请注意
如果您是一名主要使用SQL查询和BI工具的数据分析师,您可能更喜欢砖的SQLpersona-based环境。
Databricks数据科学与工程指南提供了如何指导,以帮助您最大限度地利用Databricks协作分析平台。bob体育客户端下载有关入门教程和介绍性信息,请参见开始:免费试用和安装而且什么是数据库?.
-
结构化流
学习如何使用Apache Spark Structured Streaming在Databricks中表示流数据的计算。
-
Delta活动表
学习如何使用Databricks Delta Live Tables构建数据处理管道。
-
运行时
了解Databricks运行时的类型和运行时内容。
-
集群
了解Databricks集群以及如何创建和管理它们。
-
笔记本电脑
了解什么是Databricks笔记本,以及如何使用和管理笔记本来处理、分析和可视化数据。
-
工作流
在Databricks中学习如何使用数据处理工具和框架。
-
库
在Databricks中学习如何使用和管理库。
-
回购
学习如何在Databricks中使用Git来版本控制您的笔记本电脑和其他文件。
-
DBFS
了解Databricks文件系统(DBFS),这是一个挂载到Databricks工作空间中的分布式文件系统,可在Databricks集群上使用
-
文件
了解在Databricks上处理文件的选项。
-
迁移
了解如何将数据应用程序(如ETL作业、数据仓库、ML、数据科学和分析)迁移到Databricks。