按需网络研讨会

自动机器学习(AutoML)最近受到了广泛的关注。我们相信,正确的自动化将为数据科学团队带来巨大的价值,并大大缩短实现价值的时间。Databricks通过产品供应、合作伙伴关系和定制解决方案的组合,使数据科学和机器学习过程自动化。bob体育外网下载本次演讲将重点讨论Databricks如何帮助自动化超参数调优。

对于传统机器学习和现代深度学习,调优超参数都可以显著提高模型性能并缩短训练时间。然而,调优可能是一个复杂而昂贵的过程。在这次演讲中,我们将首先简要介绍最流行的超参数调优技术(例如,网格搜索、随机搜索和贝叶斯优化)。然后,我们将讨论实现这些技术的开源工具,帮bob下载地址助实现超参数搜索的自动化。

最后,我们将在Databricks中讨论并演示我们为这些工具构建的改进,包括与MLflow的集成:

  • Apache PySpark MLlib与MLflow集成,用于自动跟踪调优
  • Hyperopt与Apache Spark集成,用于分发调优,与MLflow集成,用于自动跟踪

主持人
Joseph Bradley, Databricks软件工程师
Joseph Bradley是软件工程师和Apache Spark PMC成员,在Databricks从事机器学习工作。此前,他在2013年获得卡内基梅隆大学机器学习博士学位后,在加州大学伯克利分校担任博士后。
曹一凡,Databricks高级产品经理
Yifan Cao是Databricks的高级产品经理。他的产品领域包括ML/DL算法和Databricks Runtime for Machine Learning。在加入Databricks之前,Yifan曾致力于两个机器学习产品,应用NLP查找元数据和应用机器学习预测设备故障。他帮助ARR公司从无到有地开发出了价值数百万美元的产品。Yifan的职业生涯始于量子计算的研究人员。他在加州大学伯克利分校获得学士学位,在麻省理工学院获得硕士学位。

今天注册