MLOps

回到术语表

什么是MLOps?

MLOps代表机器学习操作。MLOps是机器学习工程的核心功能,专注于简化将机器学习模型投入生产的过程,然后维护和监控它们。MLOps是一种协作功能,通常由数据科学家、devops工程师和IT组成。

MLOps周期

mlop有什么用?

MLOps对于机器学习和AI解决方案的创建和质量来说是一种有用的方法。通过采用MLOps方法,数据科学家和机器学习工程师可以通过对ML模型进行适当的监视、验证和治理,实现持续集成和部署(CI/CD)实践,从而协作并加快模型开发和生产的速度。

为什么我们需要mlop ?

生产机器学习是困难的。机器学习生命周期由许多复杂的组件组成,如数据摄取、数据准备、模型训练、模型调优、模型部署、模型监控、可解释性等等。它还需要跨团队的协作和交接,从数据工程到数据科学再到机器学习工程。当然,它需要严格的操作严谨性来保持所有这些流程的同步和协同工作。MLOps包含了机器学习生命周期的实验、迭代和持续改进。

mlop有什么好处?

mlop的主要好处是效率、可伸缩性和风险降低。效率:MLOps允许数据团队实现更快的模型开发,交付更高质量的ML模型,以及更快的部署和生产。可伸缩性:MLOps还支持巨大的可伸缩性和管理,可以对数千个模型进行监督、控制、管理和监视,以实现持续集成、持续交付和持续部署。具体来说,MLOps提供了ML管道的可再现性,支持跨数据团队更紧密耦合的协作,减少了与devops和IT的冲突,并加快了发布速度。降低风险:机器学习模型通常需要监管审查和漂移检查,MLOps可以提高透明度,更快地响应此类请求,并确保更好地符合组织或行业政策。

mlop的组成部分是什么?

MLOps组件

机器学习项目中mlop的范围可以根据项目需求集中或扩展。在某些情况下,mlop可以包含从数据管道到模型生产的所有内容,而其他项目可能只需要mlop实现模型部署过程。大多数企业通过以下方式部署MLOps原则:
  • 探索性数据分析(EDA)
  • 数据准备和特征工程
  • 模型训练和调优
  • 模型评审和治理
  • 模型推断与服务
  • 模型的监控
  • 自动模型再训练

mlop的最佳实践是什么?

MLOps的最佳实践可以通过应用MLOps原则的阶段来描述。
  • 探索性数据分析(EDA)-通过创建可复制、可编辑和可共享的数据集、表和可视化,迭代地探索、共享和为机器学习生命周期准备数据。
  • 数据准备和特征工程—迭代转换、聚合和重复数据以创建细化的特性。最重要的是,利用特性存储,使特性在数据团队之间可见和共享。
  • 模型训练和调优-使用流行的开源库,如scibob下载地址kit-learn和hyperopt来训练和提高模型性能。作为一种更简单的选择,使用自动化机器学习工具(如AutoML)来自动执行试运行,并创建可审查和可部署的代码。
  • 模型评审和治理-跟踪模型沿袭、模型版本,并在其生命周期中管理模型工件和转换。在开源MLOps平台(如MLflow)的帮助下,跨ML模型发现、共享和协作。bob下载地址bob体育客户端下载
  • 模型推断与服务-在测试和QA中管理模型刷新频率,推理请求时间和类似的生产细节。使用CI/CD工具,如repo和orchestrator(借用devops原则)来自动化预生产管道。
  • 模型部署和监控-自动化权限和集群创建,以生产注册模型。启用REST API模型端点。
  • 自动模型再训练-创建警报和自动化,以采取纠正措施,以防由于训练和推断数据的差异而导致模型漂移。

mlop和DevOps之间有什么区别?

MLOps是一组专门用于机器学习项目的工程实践,它借鉴了软件工程中更广泛采用的DevOps原则。DevOps为发布应用程序带来了快速、持续迭代的方法,MLOps则借用了相同的原理,将机器学习模型应用于生产。在这两种情况下,结果都是更高的软件质量,更快的补丁和发布,以及更高的客户满意度。

什么是MLOps平台?bob体育客户端下载

MLOps平台为数bob体育客户端下载据科学家和软件工程师提供了一个协作环境,该环境促进了迭代数据探索、实验跟踪、特征工程和模型管理的实时联合工作能力,以及受控模型转换、部署和监控。MLOps自动化了机器学习生命周期的操作和同步方面。

MLFlow

尝试Databricks - MLflow的完全管理环境-世界领先的开放MLOps平台。bob体育客户端下载//www.neidfyre.com/try/databricks-free-ml

额外的资源


回到术语表