随需应变虚拟车间:预测客户流失率以提高客户保留率

通过赫克托耳Leano，布莱恩史密斯，Rob猎隼而且史蒂夫•索贝尔

2020年8月7日在工程的博客

分享这篇文章

从剃须用品和熟食的直接面向消费者品牌，到流媒体服务、家庭健身、汽车保险，甚至汽车本身，各行业的订阅模式都在激增。消费者正在涌向这些新产品，同时远离长期合同，这对于基于订阅的企业来说意味着他们必须每月向客户证明自己的价值。从获取来源到用于检测互动频率和类型的设备，哪些客户事件表明在不久的将来流失和更新的可能性更大?你如何决定适当的投资，以挽救处于风险中的订户，使其免于流失的风险?

简而言之，你如何利用客户行为和互动来预测客户流失并挽救最有价值的客户?

要播放此视频，请点击这里并接受cookie

在这个按需虚拟研讨会中，您将了解统一数据分析如何将数据科学、业务分析和工程结合在一起，以提高零售、媒体、电信、保险、零售金融服务等行业的客户终身价值和客户流失预测模型的精度。创新的肉类配送订阅盒ButcherBox讲述了这个快速增长的数字原生品牌如何使用客户数据，如用户交互和其他数据点，来更好地预测现有客户的终身价值和饲料下游供应链分析。

这个虚拟研讨会将让您有机会了解:

使用生存分析来了解客户何时以及可能为什么放弃订阅服务
在订阅生命周期的关键阶段预测客户流失

常见问题

问:你们多久更新一次模型来评估或改进模型?
A.没有预先定义的更新或重新运行流失预测模型的标准周期。我们能提供的最好的建议是，在您的企业做出关于流失的决策时，尽可能频繁地运行它。你是否每周都在处理用户流失问题，因为你每周都在调整支付方式或提供选项?在这种情况下，您将每周运行这篇文章。

问:在这些生存模型中，你会包含多少个多重预测因子?
答:所有这些模型都包含多个预测因子。考虑所有可能提供价值的潜在预测因子，但要确保预测因子遵循Cox PH值不随时间变化的假设。此外，要仔细考虑去除具有强共线性的变量，因为这些变量可能会干扰模型计算。最后，使用笔记本中包含的统计测试来识别和删除任何在基线之上没有统计价值的预测因子。
问:你能详细介绍一下生存模型的数据转换挑战吗?如果你有大型数据集，你会发现在创建内华达图表类型的数据时遇到了挑战，尽管这取决于你构建的模型。是否需要更多关于数据转换挑战的细节
答:生存分析例程期望源数据采用非常特定的格式。在Cox PH模型的情况下，期望每个订阅都有一个记录，其中包括订阅持续时间(在我们的场景中以天为单位)以及在持续时间结束时的订阅状态。然后将预测特征与分类特征一一转换。

问:在对高频次消费者(杂货店，频次通常是几天或一周)进行生存分析时，你可能会遇到哪些困难?
答:数据工程绝对是最大的挑战。请记住，您希望将所有这些交互总结为一条记录，以便进行分析。这是大量的数据处理，大多数系统无法处理。增加复杂性的是，您需要迭代为单个记录提取哪些特征。

问:生存率和癌症有什么区别保留率？或者我们只是互换使用?
答:为了本次网络研讨会和相关的博客文章，我们交替使用客户留存率和客户存活率:-)

问:你如何处理观测数据的数量?例如，第30天的注册人数可能是第10天的10倍。
答:通过对这些层进行分层，我们可以计算每个层的统计数据。在卡普兰-迈耶曲线中，每条曲线都有95%的置信区间这取决于观测数据的数量。你可以在先前订阅K-M曲线上清楚地看到这一点。
我们能否使用这些生存模型输出来计算客户生命周期价值?
答:一旦我们有了预测模型，我们就可以确定计算CLV的时期结束日期，并获得留存率/生存概率。例如，如果我要以每年为基础计算3年CLV，我将在365、730和1095天的点上获得留存率。

问:实现这种方法(整个架构)需要多长时间?
答:这取决于你所在的公司。如果你有可用的数据，你可以部署我们的笔记本电脑，并在几天内连接你的数据。我们通常用这个代码和客户做poc，从来不会超过2周。

问:你的模型考虑过季节性因素吗?
答:CLV有考虑季节性因素的机器学习模型，但一般来说，当季节性因素成为考虑因素时，我会非常仔细地检查我试图预测的东西。通常情况下，当我们开始着眼于季节性时，我们会尝试着做出一个比CLV更精确的收益预测。