什么是AutoML?

Databricks AutoML帮助您自动将机器学习应用于数据集。您提供数据集并识别预测目标,而AutoML则为模型训练准备数据集。AutoML然后执行并记录一组创建、调优和评估多个模型的试验。在模型评估之后,AutoML会显示结果,并为每次试验运行提供一个Python笔记本,其中包含源代码,以便您可以检查、复制和修改代码。AutoML还计算数据集上的汇总统计信息,并将这些信息保存在笔记本中,以便稍后查看。

您可以使用Databricks AutoML进行回归、分类和预测问题。BOB低频彩了解更多Databricks AutoML如何工作

需求

  • Databricks运行时9.1 ML或以上。对于通用可用性(GA)版本,Databricks Runtime 10.4 LTS ML或以上版本。

    • 对于时间序列预测,Databricks运行时10.0 ML或以上。

    • 在Databricks Runtime 9.1 LTS ML及以上版本中,AutoML依赖于databricks-automl-runtime包,它包含在AutoML之外有用的组件,还有助于简化由AutoML训练生成的笔记本。databricks-automl-runtime可于PyPI

  • 除了在Databricks Runtime for Machine Learning中预安装的库之外,不应该在集群上安装其他库。

    • 对现有库版本的任何修改(删除、升级或降级)都会由于不兼容而导致运行失败。

  • 在一个高并发集群, AutoML不兼容表访问控制凭据透传

  • 使用统一目录与AutoML,的集群接入方式必须单用户,且必须为集群指定的单个用户。