通过倾向评分开始个性化

通过田谭，山姆Steiny而且布莱恩史密斯

2022年6月3日在行业

分享这篇文章

消费者越来越希望以个性化的方式参与其中。无论是促销商品的电子邮件信息，以补充最近的购买，在线横幅宣布销售的产品在一个经常浏览的类别，或内容与表达的兴趣，消费者有越来越多的选择，他们花钱的地方，更喜欢这样做的网点，认识到他们的个人需求和喜好。

一个最近的调查麦肯锡的调查强调，近四分之三的消费者现在希望个性化互动成为他们购物体验的一部分。这项调查所包含的研究强调，在这方面做得好的公司将通过个性化服务产生40%以上的收入，这使得个性化成为顶级零售业绩的关键区别。

尽管如此，许多零售商仍在为个性化服务苦苦挣扎。一个最近的调查调查发现，只有30%的美国消费者和26%的英国消费者认为零售商在为他们创造相关体验方面做得很好。在一个独立调查到3radical，只有18%的受访者强烈认为他们收到了定制化的推荐，而52%的受访者对收到无关的沟通和报价表示沮丧。随着消费者越来越多能够切换品牌和网点，正确的个性化已经成为越来越多的企业的优先事项。

个性化是一个旅程

对于一个刚接触个性化的组织来说，交付一对一约定的想法似乎令人生畏。我们如何克服孤立的流程、糟糕的数据管理和对数据隐私的担忧，来组装这种方法所需的数据?我们如何在有限的营销资源下制作出真正个性化的内容和信息?我们如何确保我们创建的内容有效地针对不断变化的需求和偏好的个人?

虽然很多关于个性化的文献都强调了最前沿的方法，这些方法因其新颖性而脱颖而出(但并不总是如此)有效性)，现实是个性化是一个旅程．在早期阶段，重点放在利用第一方数据，这样更容易维护隐私和客户信任。应用相当标准的预测技术来提高已证明的能力。随着价值被证明，组织不仅适应了这些新技术，而且适应了将它们集成到实践中的各种方式，然后就会采用更复杂的方法。

倾向评分通常是走向个性化的第一步

个性化之旅的第一步通常是检查销售数据，以了解个人客户的偏好。在一个被称为倾向评分的过程中，公司可以估计客户对要约或与产品子集相关的内容的潜在接受度。使用这些分数，营销人员可以确定在他们所掌握的众多信息中，哪一条应该呈现给特定的客户。同样地，这些分数可以用来确定哪些客户或多或少地接受某种特定形式的参与。

大多数倾向评分练习的起点是从过去的交互中计算数值属性(特征)。这些特征可能包括诸如客户的购买频率、与特定产品类别相关的支出百分比、距离上次购买的天数以及许多来自历史数据的其他指标。然后，在计算这些特征的时期之后的历史时期进行检查，以寻找感兴趣的行为，例如购买特定类别的产品或兑换优惠券。如果观察到行为，则标记1与特征相关联。如果不是，则分配一个标签为0。

使用这些特征作为标签的预测因子，数据科学家可以训练一个模型来估计感兴趣的行为发生的概率。将这个训练过的模型应用到最近一段时间计算的特征上，营销人员可以估计出客户在可预见的未来参与这种行为的概率。

有了大量的优惠、促销、消息和其他内容，我们可以训练大量的模型，每个模型预测不同的行为，并将其应用于相同的功能集。由每个感兴趣的行为的分数组成的每个客户概要文件被编译，然后发布到下游系统，供营销人员在各种活动的编排中使用。

Databricks提供了倾向评分的关键功能

尽管倾向评分听起来很简单，但它并非没有挑战。在我们与实施倾向评分的零售商的对话中，我们经常遇到同样的三个问题:

我们如何保持我们用来训练倾向模型的100个，有时是1000个特征?
我们如何快速训练与营销团队希望追求的新活动相一致的模型?
我们如何快速地重新部署模型，随着客户模式的漂移而重新训练，进入评分管道?

在Databricks，我们的重点是通过一个基于企业端到端需求构建的分析平台为客户提供支持。bob体育客户端下载为此，我们将Feature Store、AutoML和MLFlow等功能整合到我们bob体育客户端下载的平台中，所有这些功能都可以作为稳健倾向评分过程的一部分来解决这些挑战。

特色商店

的Databricks功能商店是一个集中式的存储库，支持跨各种模型训练练习的持久性、发现和共享特性。随着特征被捕获，谱系和其他元数据也被捕获，以便希望重用其他人创建的特征的数据科学家可以自信而轻松地这样做。标准安全模型确保只有经过许可的用户和流程才能使用这些特性，这样数据科学流程就可以根据组织的数据访问策略进行管理。

AutoML

砖AutoML允许您利用行业最佳实践快速生成模型。作为一个玻璃盒解决方案，AutoML首先生成一个笔记本集合，表示与您的场景一致的不同模型变化。虽然它迭代训练不同的模型，以确定哪个模型最适合您的数据集，但它允许您访问与每个模型相关联的笔记本。对于许多数据科学团队来说，这些笔记本成为了进一步探索模型变化的可编辑起点，最终使他们能够得到一个训练有素的模型，他们相信可以满足他们的目标。

MLFlow

MLFlow是一个开源的bob下载地址机器学习模型存储库，在Databricks平台内管理。bob体育客户端下载这个存储库允许数据科学团队跟踪和分析由AutoML和自定义训练周期生成的各种模型迭代。它的工作流管理功能允许组织快速地将训练有素的模型从开发转移到生产，以便训练有素的模型可以更立即地对操作产生影响。

当与Databricks Feature Store结合使用时，使用MLFlow持久化的模型保留了训练期间使用的特性的知识。在检索模型进行推理时，这些相同的信息允许模型从特征存储中检索相关的特征，极大地简化了评分工作流程，并实现了快速部署。

构建倾向评分工作流

结合使用这些特性，我们看到许多组织将倾向评分作为三部分工作流的一部分来实现。在第一部分中，数据工程师与数据科学家一起定义与倾向评分练习相关的特征，并将这些特征持久化到特征存储中。然后定义每日甚至实时的特征工程流程，以便在新数据输入到达时计算最新的特征值。

接下来，作为推理工作流的一部分，客户标识符将呈现给之前训练过的模型，以便根据最新可用的特征生成倾向评分。使用模型捕获的特征存储信息允许数据工程师检索这些特征并相对轻松地生成所需的分数。这些分数可以在Databricks平台中持久化以供分析，但更典型的是发布到下游营销系统。bob体育客户端下载

最后，在模型训练工作流中，数据科学家定期重新训练倾向评分模型，以捕捉客户行为的变化。当这些模型被持久化到MLFLow时，变更管理过程被用来评估模型，并将那些满足组织标准的模型提升到生产状态。在推理工作流的下一个迭代中，检索每个模型的最新生产版本以生成客户评分。

为了演示这些功能如何协同工作，我们基于一个公开可用的数据集构建了一个倾向评分的端到端工作流。这个工作流演示了上面描述的工作流的三个部分，并展示了如何使用Databricks的关键功能来构建有效的倾向评分管道。

下载资产在这里，并以此为起点，使用Databricks平台构建您自己的个性化基础。bob体育客户端下载

免费试用Databricks

开始

看到所有行业的帖子