模型部署模式

本文描述了两种常见模式正毫升工件通过分期和恢复生产。改变模型的异步本性和代码意味着有多个可能的模式,一个毫升开发过程可能也会步其后尘。

模型是由代码,但由此产生的模型工件和创造它们的代码可以异步操作。和代码更改,新模型版本可能不发生在同一时间。例如,考虑以下场景:

检测欺诈性交易,您将开发一个毫升管道通过每周一个模型。代码可能不是经常变化,但该模型可能接受再培训,每周将新数据。
您可以创建一个大型的、深层神经网络对文档进行分类。在这种情况下,训练模型计算昂贵和耗时的,培训模型可能会经常发生。然而,部署的代码,可以更新服务,并监视这个模型没有培训模型。

两种模式的区别在于是否模型工件或培训生产模型工件的代码正在向生产推广。

部署代码(推荐)

在大多数情况下,砖推荐“部署代码”的方法。这种方法纳入推荐MLOps工作流。

在此模式中,火车模型的代码在开发环境中开发的。相同的代码移动到暂存,然后生产。模型训练在每个环境:最初在开发环境中作为模型开发的一部分,在分段(数据)的有限子集作为集成测试的一部分,并在生产环境中(完整的生产数据)来产生最终的模型。

优点:

缺点:

也在此模式中,数据科学家必须能够评估培训结果的生产环境中,他们的知识来识别并修复ML-specific问题。

如果你的情况要求模型被训练在举办全面生产数据集,您可以使用一个混合的方式通过部署代码阶段,训练模型,然后将其部署到生产环境模型。这种方法可以节省培训成本在生产但在分段添加了一个额外的运营成本。

在此模式中,生成模型工件通过训练代码在开发环境中。测试工件的登台环境部署到生产。

这个选项可以被认为是一个或多个以下应用:

优点:

缺点:

下图对比的代码上面部署模式在不同生命周期执行环境。

图中所示的环境是最后一步是运行环境。例如,在模式部署模型,最后在开发环境中执行单元测试和集成测试。在部署代码模式中,单元测试和集成测试开发环境,运行和最终执行单元测试和集成测试的登台环境。