客户的故事
建立一个运作高效的全渠道业务

工业:零售及消费品

解决方案:客户生命周期价值需求预测安全库存分析威胁检测用户流失预测

bob体育客户端下载平台用例:Lakehouse三角洲湖机器学习砖的SQLETL

云:Azure

巴西消费者依靠Via(以前的Via Varejo)购买广泛的商品和服务——从消费电子产品和家用电器到家具和信用卡。但由于数十年的筒仓数据影响着不同的业务决策,而且Hadoop数据仓库非常复杂,无法促进机器学习创新,因此Via很难准确预测需求,这影响了他们的整个供应链。通过在Databricks Lakehouse平台上统一数据和分析,Via能够开发一个可扩展的架构,使整个组织都能访问bob体育客户端下载数据。这使得机器学习能够更快地投入市场,并提供洞察,揭示关键的消费者趋势,以优化业务运营,防止欺诈活动,并在接触点上创建更有针对性的零售体验。

将几十年不相关的数据整合在一起

消费者在Via购物已有60多年的历史,Via是一家拥有近1亿客户的巴西主要零售商。但由于数十年的数据错位和孤立的渠道影响了整个组织的决策方式,Via的数据团队努力拼凑出消费者需求的完整图景,以塑造业务运营和供应链考虑因素。

由于业务的持久性和性质,Via拥有许多传统的事务环境,包括一个构建在Hadoop上的大型机。多年来,他们将其与Teradata数据仓库进行了整合,该数据仓库管理复杂,无法支持数据科学家的需求,迫使他们在个人笔记本电脑上构建和训练模型。如果没有能力针对整个数据集进行协作和扩展训练,数据科学家就无法在相关信息的背景下全面评估见解。

Via MLOps经理Cezar Steinz表示:“协作是一大痛点,可扩展性也是一大痛点。“我们需要用完整的数据来训练我们的模型。这可能超过240亿行信息。在笔记本电脑上训练这些模型是不可能的。”

这导致分析的准确性下降,从而破坏了从客户旅程到欺诈预防的一切,最终降低了收入并减缓了增长。Via意识到,为了充分授权他们的数据科学家和分析师,他们不仅需要一个公共的数据层,还需要有效地协作操作数据的能力,以帮助供应链优化、需求预测等。为了构建统一的数据结构并简化分析和ML, Via转向了Databricks。

数据治理、欺诈预防和消费者需求

Azure上的Databricks Lakehoubob体育客户端下载se平台使Via能够获得有助于做出更好商业决策的见解,包括计算客户流失、确定下一个最佳报价或行动(NBO/NBA)、检测和减少欺诈,以及开发推动转换和金融服务(信用个性化和其他支付方式)的定价模型。

通过lakehouse方法,Via现在对他们的数据有了一个用于分析和ML的共同视图。Delta Lake用于提供数据一致性和可靠性,因为该公司构建ETL管道,通过与Power BI集成来提供BI仪表板,并支持ML模型的训练。更重要的是,他们能够以优异的表现和自信交付,这对满足他们日常决策需求至关重要。

“Databricks为我们提供了更好的数据治理,”Steinz说。“通过Delta Lake,分析师可以访问解决手头特定用例所需的确切数据——例如,如果我们谈论的是物流运营商,我们只访问相关的物流数据表。我们可以与合适的人分享特定的数据,这是最理想的。”Delta Lake还为Via提供了更好的可追溯性,这样他们就可以更好地了解他们的数据是如何被使用的,以及他们是否可以在不同的ML模型中重用一些数据。

Feature Store是一个集中的功能存储库,为Via的数据科学家和分析师提供了轻松共享和发现功能的能力。这使得他们不仅能够真正统一他们的数据,而且能够真正统一访问和使用数据的团队,从而为业务做出更好、更明智的决策。“Databricks Feature Store使我们能够创建一个健壮而稳定的环境来创建和重用模型所消耗的特性,”Steinz说。“这使得我们的数据科学家和分析师的工作效率更高,因为他们不再需要浪费时间每次都从头开始将数据转换为特征。”

由于他们的数据集中在湖屋,他们的分析师使用Databricks SQL快速分析数据,并通过Power BI仪表板和报告与其他业务共享见解。通过MLflow, Via的数据科学家能够轻松地管理ML的整个生命周期——从跟踪模型版本到运行实验和审查结果。Steinz解释说:“使用MLflow创建一个项目是至关重要的,因为它使得我们可以在任何平台上运行一个模型。”bob体育客户端下载“这意味着我们不再局限于如何部署ML来影响我们的业务。”

数据民主化和简化ML模型

随着数据性能的提高和数据科学对所有数据的处理,Via已经能够快速开发和部署ML模型,帮助进行流失预测、产品推荐、欺诈和信用分析以及客户行为分析。这些不同的用例使Via能够提供安全的、高度针对性的购物体验,以满足变化无常的客户的需求,从而提高转化率和客户终身价值。在分析方面,对数据的统一视图使他们能够提取洞察,帮助指导战略,从简化供应链运营到新产品创新机会,让客户满意。

从操作的角度来看,Databricks帮助降低了计算成本并促进了跨团队协作。在整个数据组织中,Via实现了30%的生产力提高,估计总共节省了390万雷亚尔。在Feature Store和自动化集群管理的帮助下,他们还发现数据处理成本下降了25%。

Steinz表示:“我们的数据部门以指数级增长,我们以快速、一致和高价值的交付满足业务期望。“多亏了Databricks Lakehouse平台及其背后的专家,这才有可能实现。”bob体育客户端下载

展望未来,随着数据民主化在他们的文化中根深蒂固,威盛已做好充分准备,通过利用数据和人工智能提供尽可能好的购买体验,实现他们的使命,让客户的梦想成真。

  • R 390万美元
    由于生产力的提高而节省
  • 25%
    降低计算成本

Databricks Lakehouse让我们能够释放分析和机器学习的力量。现在我们可以利用我们所有的数据来提供行业领先的购物体验,同时提高运营效率。”

——Cezar Steinz (Via MLOps经理