砖的解决方案架构师和高级ex-Teradata数据工程师专注于实施机器学习工作负载在云。
数据&毫升项目带来许多新的复杂性超出了传统的软件开发生命周期。与软件项目不同的是,他们成功地交付和部署后,他们不能放弃但必须不断监控如果模型性能仍然满足所有的需求。我们总是可以得到新的数据与统计特征可以打破我们的管道或影响模型的性能。所有这些品质的数据&毫升项目让我们连续测试的必要性和监控我们的模型和管道。
在这个演讲,我们将展示如何CI / CD模板可以简化这些任务:引导新数据项目的一分钟内,设置CI / CD管道使用GitHub动作,实现集成测试砖。所有这一切都是有可能的,因为约定由CI / CD引入模板帮助抽象数据管道和ML的自动化部署及试验模型。
演讲者:迈克尔·Shtelma和伊万Trusov
数据&毫升项目带来许多新的复杂性超出了传统的软件开发生命周期。与软件项目不同的是,他们成功地交付和部署后,他们不能放弃但必须不断监控如果模型性能仍然满足所有的需求。我们总是可以得到新的数据与统计特征可以打破我们的管道或影响模型的性能。
所有这些品质的数据&毫升项目让我们连续测试的必要性和监控我们的模型和管道。在这个演讲,我们将展示如何CI / CD模板可以简化这些任务:引导新数据项目的一分钟内,设置CI / CD管道使用GitHub动作,实现集成测试砖。所有这一切都是有可能的,因为约定由CI / CD引入模板帮助抽象数据管道和ML的自动化部署及试验模型。
CI / CD模板由Runtastic用于砖管道的自动化部署流程。在这个网络研讨会Emanuele Viglianisi、数据工程师Runtastic将展示如何使用CI / CD Runtasic模板在日常开发运行,测试和部署他们的管道直接从IDE PyCharm砖。埃将Runtastic面临的挑战以及他们如何成功解决他们通过整合CI / CD的工作流模板。
演讲者:迈克尔Shtelma和埃Viglianisi
毫升发展带来许多新的复杂性超出了传统的软件开发生命周期。毫升项目,与软件项目不同的是,他们成功地交付和部署后,不能放弃,但必须不断监控如果模型性能仍然满足所有的需求。在大多数毫升用例,我们需要处理更新训练集,从而影响模型性能。此外,大多数模型需要在运行时某些数据预处理和后期处理,使部署过程更具挑战性。在这次演讲中,我们将展示如何使用MLflow建立一个自动化CI / CD管道可以部署一个新版本的模型和代码在生产。此外,我们将展示如何可以使用相同的方法在数据训练管道将在新数据到来重新训练模型和部署模型的新版本是否满足所有的需求。
毫升发展带来许多新的复杂性超出了传统的软件开发生命周期。与传统的软件开发,毫升开发者想尝试多个算法,工具和参数来得到最好的结果,他们需要跟踪这个信息复制工作。此外,开发人员需要使用许多不同的系统productionize模型。
为了解决这些挑战,砖公布了去年MLflow,一个开源项目,旨在简化整个毫升生命周期。bob下载地址MLflow介绍简单的抽象包可再生项目,跟踪结果,和封装模型,可以用于许多现有的工具,加速毫升为任何规模的组织生命周期。
在过去的一年中,MLflow社区增长迅速:120多个贡献者来自超过40公司项目贡献代码,并使用MLflow超过200家公司。
在本教程中,我们将向您展示如何使用MLflow可以帮助您:
我们将演示的基石MLflow以及最新的1.0版本以来的添加。
你将学习:
先决条件:
毫升发展带来许多新的复杂性超出了传统的软件开发生命周期。与传统的软件开发,毫升开发者想尝试多个算法,工具和参数来得到最好的结果,他们需要跟踪这个信息复制工作。此外,开发人员需要使用许多不同的系统productionize模型。
为了解决这些挑战,砖公布了去年MLflow,一个开源项目,旨在简化整个毫升生命周期。bob下载地址MLflow介绍简单的抽象包可再生项目,跟踪结果,和封装模型,可以用于许多现有的工具,加速毫升为任何规模的组织生命周期。
在过去的一年中,MLflow社区增长迅速:120多个贡献者来自超过40公司项目贡献代码,并使用MLflow超过200家公司。
在本教程中,我们将向您展示如何使用MLflow可以帮助您:
我们将演示的基石MLflow以及最新的1.0版本以来的添加。
你将学习:
先决条件: