建立在一个开放的lakehouseDatabricks Machine Learning使ML团队能够准备和处理数据,简化跨团队协作,并标准化从实验到生产的整个ML生命周期。
简化ML数据的所有方面
因为Databricks ML是建立在一个开放的lakehouse基础与三角洲湖,您可以授权您的机器学习团队访问、探索和准备任何规模的任何类型的数据。在不依赖数据工程支持的情况下,以自助方式将功能转换为生产管道。
自动化实验跟踪和管理
Managed MLflow自动跟踪您的实验并记录参数、指标、数据和代码的版本,以及每次训练运行的模型工件。您可以根据需要快速查看以前的运行,比较结果并重现过去的结果。一旦您确定了用于生产的模型的最佳版本,将其注册到model Registry以简化部署生命周期中的交接。
管理从数据到生产的整个模型生命周期
一旦训练好的模型被注册,您就可以通过Model Registry在它们的生命周期中协作地管理它们。模型可以通过不同的阶段进行版本控制和移动,比如实验、分期、生产和存档。生命周期管理根据基于角色的访问控制与审批和治理工作流集成。评论和电子邮件通知为数据团队提供了丰富的协作环境。
大规模和低延迟部署ML模型
只需单击就可以部署模型,而不必担心服务器管理或规模限制。使用Databricks,您可以将模型部署为具有企业级可用性的任何地方的REST API端点。

产品组件
迁移到Databricks
厌倦了与Hadoop和企业数据仓库等遗留系统相关的数据筒仓、缓慢的性能和高成本?迁移到Databricks Lakehouse:所有数据、分析和人工智能用例的现代平台。bob体育客户端下载