跳转到主要内容
公司博客上

实施大规模机器学习砖和埃森哲

2020年4月7日 公司博客上

分享这篇文章
Atish射线客座博客,应用情报和Nathan Buesgens埃森哲咨询公司董事总经理,经理,埃森哲

虽然许多机器学习飞行员成功,缩放和操作完全成熟的应用程序提供关键业务成果仍然是一个关键的挑战。埃森哲和砖合作克服这一点,Atish雷写道,埃森哲咨询公司董事总经理应用智能,专门从事大数据和人工智能。

2019年,机器学习(ML)应用程序和平台吸引了平均bob体育客户端下载全球420亿美元的资金。尽管这一承诺,缩放和操作全面毫升应用程序仍然是一个关键的挑战,尤其在商业环境中,许多长期的工业化毫升尚未意识到的好处。

虽然毫升是因其学习能力模式的数据,随后提高性能和结果基于经验,扩展的障碍是多种多样的。例如,缺乏良好的管理的元数据的端到端毫升生命周期可能会导致基本信任和可跟踪性问题。所需的技能和技术的快速发展,传统的经营模式和业务流程的潜在不相容,特别是,在移动毫升构成障碍从试点阶段投入生产应用。

好消息是,最新进展和可用性的几个AI和ML技术取得了必要的工具民主化和工业化毫升应用程序的生命周期。越来越受欢迎和使用公共云使得组织能够存储和处理更多的数据比以往更高效率利用25毫升的先决条件应用规模和最高效地运行。

创新来自开源社区支持的公司如砖了最bob下载地址先进的产品,允许科学家、工程师和建筑师共同协作和快速构建和部署毫升应用程序。,过去需要一个机器学习的博士学位,现在已经被抽象成各种各样的软件工具和服务,这是民主化较为多样化的用户使用。

把所有这一切与一个行业的深入了解和它的数据,和显然从来没有一个更好的时间组织大规模部署和运营毫升。

什么使ML生命周期的一个复杂、协作过程?

监控如果毫升持续结果业务在一段时间内,深入了解的人,流程和技术毫升生命周期的每个阶段(图1)是至关重要的。从一开始,关键利益相关者必须对齐究竟是他们需要实现的业务。

端到端机器学习产品生命周期

图1:一个端到端的毫升产品生命周期

在业务上下文中,的最佳实践之一是首先优先一个或两个业务挑战周围建立一个最小可行产品或MVP由最初的基础。一旦建立和必要的数据准备,一个实验阶段发生来确定正确的模型对于任何给定的问题。

模型被选中后,测试,调整完成,毫升应用程序准备好实施。传统上,这项工作需要这一点已经数据科学家关注的大部分时间。然而,为了实施大规模、模型可能需要部署在特定的平台,比如云平台,或者集成到面向用户的业务应用程序。bob体育客户端下载

一旦这一切完成之后,下一步是监视和优化性能的这些学习模型作为他们部署到生产环境中,在那里他们提供具体结果如提出建议和预测或监视某些类型的操作效率。

在一个案例中,例如,在线广告公司在日本是利用毫升为广告交付创建目标客户列表。他们成功地创建精确的模型,但遭受高运营成本的建筑模型和评估目标的结果。有迫切需要规范化和自动化过程的措施。

为了解决这个问题,埃森哲来构建一个可重用的脚本工具,实现训练、测试和验证模型。脚本从一个GUI前端,集成了ML流使轻松部署,大大减少了DevOps规模所需的时间和精力。

在另一起案件中,一个大型医药零售商在美国正竭力与8000万+基地成员通过提供由其忠诚计划。它需要一种方法来增加隆起,但除了手动流程,没有系统构建一个可靠的、统一的和可再生的ML管道评估数十亿的组合提供了数百万的客户在持续的基础上。

埃森哲的个性化引擎开发和交付数据砖平台构建、火车、测试、验证和部署模型的规模,在成千上万的客户,提供数十亿美元,成千上万的产品。bob体育客户端下载自动ML模式部署过程和现代化智能管道也部署。结果是显著降低了DevOps的时间和精力在部署模型,估计和业务能够实现20%的利润率较高的飞行员零售店。

工业技术构建块毫升是什么?

利用建立与确立了等专家作为构建块的两种情况概述above-accelerates的构建和部署这些类型的项目,可以迭代,逐步扩展和应用日益复杂的业务成果。

帮助客户建立和运营这些毫升应用,埃森哲与砖。埃森哲是利用砖平台建立的关键技术基础需要解决的三个核心领域工业ML:协作bob体育客户端下载、数据依赖和部署(图2)。

砖的统一分析数据平台支持bob体育亚洲版关键技术组件的三个基本领域,和bob体育客户端下载埃森哲已经发展出了一套额外的技术组件和集成数据砖平台共存。这也包括一套可重用的组件,加快协作,提高理解的数据和简化操作部署。

最终,这一伙伴关系的目的是简化的方法,已被证明成功的大规模部署。bob体育外网下载

componentspartnership的砖,埃森哲的解决方案架构,突出点的协作、数据依赖和部署bob体育外网下载,和基础设施。

图2:协作、数据依赖和部署

基于丰富的实施经验,我们知道工业化毫升的组织开发和部署是解决我们解决三个基本领域:

协作

跨组织边界分析社区的全面合作,管理和共享的特性和模型,是成功的关键。作为一个协作环境,砖工作空间提供了一个空间数据工程师和科学家可以共同探索数据集,构建模型迭代和执行实验和数据管道。MLflow是一个关键的组件从砖和开源项目合作在ML生命周bob下载地址期从实验到部署和允许用户跟踪模型性能,版本和可重复的结果。

埃森哲将工具包模型和特性的工程对于许多场景,例如一个推荐引擎,接连毫升应用全生命周期。它利用行业知识成功的模型,使基线生产反馈告知校准工作。

数据依赖

我们不能强调足够的可用数据集访问和理解的重要性和相关元数据驱动成功的结果。我们的数据依赖项组件捕获准则、规则形状数据,并提供可视化的图表来帮助评估数据质量。这提高了数据采集的速度和内容管理,进一步加速了解工程的数据和提高效率的功能。

砖平台提供了一些功能来提高数据bob体育客户端下载质量和加工性能。三角洲湖,可用作为砖的一部分,是一个开源存储层,支持ACID事务和数据质量特性,并将可靠性bob下载地址数据的湖泊在规模。Apache火花大数据提供了一个高度可扩展引擎和ML,高性能的额外增强从砖。

部署

而实验需要数据科学知识应用正确的解决方案,正确的行业问题,部署需要集成,跨职能团队。我们部署组件使用元数据驱动的方法来构建和部署毫升管道代表连续工作流程从开始到验证。通过启用标准和部署模式,这些组件可以实施实验。

砖企业云服务是一个简单的、安全的和可伸缩的托管服务,支持高性能毫升管道的统一部署和应用程序。更重要的是,部署和管理的治理结构生产模型和漂移也可以启用。这些组件集成在一起,从砖和埃森哲交付重要加速度毫升的部署生命周期在AWS和Azure云。

在部署大规模毫升之前的关键因素是什么?

对于那些考虑毫升的工业化方法,有几个关键问题先考虑。它们包括:

  1. 业务涉众对齐毫升需要解决的业务问题和主要成果需要达到的期望吗?
  2. 是正确的角色和技能以规模和监控毫升部署申请成功的实验?
  3. 是必要的基础设施和自动化的需求理解和工业化毫升可用的解决方案吗?
  4. 数据科学团队有正确的运营模式,标准和推动者需要避免重大部署再造一次实验做了什么?

工业化毫升时,它可以容易先建立一个很深的技术基础,解决生命周期的各个方面。然而,往往这种方法风险的业务成果和遇到的挑战与采用,花和对齐方式。

相反,我们经历了成功的迭代开发这些基金会在关键业务环境中,通过构建连续周期交付增量业务成果。

关于埃森哲

埃森哲是全球领先的专业服务公司,提供范围广泛的服务和解决方案的策略,咨询、数字技术和操作。结合无与伦比的经验和专业技能在40多个行业和所有业务功能——世界最大的交付网络支撑的埃森哲交集的业务和技术,帮助客户改善他们的表现和他们的利益相关者创造可持续的价值。有超过492000人在120多个国家,服务客户埃森哲推动创新来改善世界工作和生活的方式。在访问我们www.accenture.com

本文档是由咨询公司埃森哲一般指导。它并不打算提供具体建议在你的情况下。如果你需要建议或进一步的细节在任何问题提到,请联系您的埃森哲的代表。

本文档是描述性的引用可能属于别人的商标。这种商标的使用本不是一个断言这样的商标所有权由埃森哲和并不打算代表或暗示的存在,埃森哲与这些商标的合法所有者。

版权©2019埃森哲。保留所有权利。埃森哲咨询公司,它的标志,和高的性能。交付。是埃森哲的商标。

免费试着砖
看到所有公司博客上的帖子