在Databricks中开始学习机器学习

本笔记本提供了在Databricks上的机器学习模型训练的快速概述。要训练模型,可以使用预安装在Databricks Runtime ML中的scikit-learn库MLflow对训练过的模型进行跟踪Hyperopt使用SparkTrials缩放超参数调整。

在本教程中,您将使用MLflow来跟踪模型开发,并使用Hyperopt来训练一个简单的分类模型,以提高模型的性能。有关在Databricks上生产机器学习的更多详细信息,包括模型生命周期管理和模型推断,请参阅ML端到端示例

有关在Databricks上快速入门的其他示例笔记本,请参见教程:开始学习ML

需求

Databricks Runtime 7.5 ML或以上。

请注意

如果您无法访问Databricks Runtime 7.5 ML或以上版本,请尝试开始scikit-learn在数据库教程:Databricks上的端到端ML模型

例如笔记本电脑

机器学习快速入门笔记本

在新标签页打开笔记本