教程:开始学习ML

本文中的笔记本旨在帮助您快速入门Databricks上的机器学习。你可以导入每个笔记本电脑到Databricks工作区来运行它们。

这些笔记本说明了如何在机器学习生命周期中使用Databricks,包括数据加载和准备;模型训练、调优和推断;以及模型部署和管理。它们还演示了一些有用的工具,例如Hyperopt对于自动超参数调优,MLflow跟踪以及模型开发的自动记录,还有模型注册用于模型管理。

scikit-learn笔记本

笔记本

需求

特性

机器学习入门

Databricks Runtime 7.5 ML或以上

分类模型,MLflow,使用Hyperopt和MLflow进行自动超参数调优

使用模型注册表进行机器学习

Databricks运行时ML

分类模型,MLflow,自动超参数调优与Hyperopt和MLflow,模型注册

的端到端示例

Databricks运行时ML

分类模型,MLflow,使用Hyperopt和MLflow的自动超参数调优,XGBoost,模型注册表,模型服务

Apache Spark MLlib笔记本

笔记本

需求

特性

用MLlib进行机器学习

Databricks运行时ML

逻辑回归模型,Spark管道,使用MLlib API自动超参数调优

深度学习笔记本

笔记本

需求

特性

TensorFlow Keras的深度学习

Databricks运行时ML

神经网络模型,内联TensorBoard,使用Hyperopt和MLflow进行自动超参数调优,自记录,ModelRegistry