工程的博客

按需网络研讨会:大规模粒度需求预测

分享这篇文章

我们最近举办了一场网络研讨会星巴克如何利用Facebook Prophet和Databricks进行大规模需求预测-在这次网络研讨会上,我们了解了为什么需求预测对零售/ CPG公司至关重要,以及它如何实现其他22个用例。星巴克数据科学经理Brendan O’shaughnessy向我们介绍了星巴克是如何进行大规模需求预测的。我们还一步步演示了如何使用Databricks和Facebook的Prophet在一天/商店/SKU级别上执行细粒度的需求预测

数字化金融时间序列分析。

网络研讨会的幻灯片可以在这里

为什么要进行细粒度需求预测?星巴克是怎么做的?

在日存储- sku上执行细粒度预测超出了传统的基于数据仓库的预测工具的能力。对产品的需求因产品、商店和日期而异,而传统的需求预测解决方案在总市场、周和促销组级别进行预测。

随着Databricks统一数据分析平台的引入,零售商的预测准确性有了两位数的提高。bob体育客户端下载他们可以在SKU、存储和日期执行细粒度预测,并包括数百个附加功能来提高模型的准确性。他们可以通过本地化和容易地包含额外的数据集进一步增强预测。他们每天都在进行这些预测,为他们的规划人员和零售运营团队提供及时的数据,以便更好地执行。

在本次网络研讨会中,我们回顾了:

  • 如何使用Databricks在一天/商店/SKU级别上执行细粒度的需求预测
  • 如何精确预测时间序列数据Facebook的先知
  • 同时,如何星巴克自定义预测相对容易吗
  • 如何使用事实上的分布式数据处理引擎训练大量的模型,Apache火花™
  • 最后,我们将这些数据展示给分析师和经理使用BI工具使所需的决策能够驱动所需的业务结果

在研讨会的最后,我们进行了问答环节。以下是问题和答案:

问:你应用了什么模型版本控制技术来显示模型是如何随着时间的推移而改进的?

我们的许多客户都使用MLflow追踪他们的实验。他们可以使用MLflow跟踪与这些模型相关的各种参数,并比较不同模型的性能指标。这有助于跟踪改进,以及他们用来获得见解的库。MLflow帮助这些模型更快地从实验阶段进入生产阶段。

问:为什么使用udf而不是MLlib?这是为了访问吗SciKit学模型?

我们正在使用udf因此,我们可以灵活地利用任意数量的库。Facebook的先知现在非常流行,但我们有很多库可以用于时间序列。在某些场景中,有些比其他的更合适。因此,通过使用udf,我们获得了最大的灵活性,同时还利用了并行化。

问:如何三角洲湖帮助进行需求预测?

如果我要做大,有很多问题,这将花费我多少钱?我们显然想要做的一件事就是利用云计算和这些资源,尽可能快速和积极地大规模运行我们的预测。然后,当我们想要将这些资源释放回云提供商时,我们不需要为此付费。当我这样做的时候,我该如何处理我的预测呢?我不想失去我从运行模型中得到的见解。这些结果在a数据帧,这意味着它们最终驻留在内存中。所以我们要做的是,持久化数据并存储它。我们的首选格式是三角洲湖三角洲湖可以让我快速地与这些数据交互并将其作为表格打开。通过持久化该数据,我现在可以选择为该数据带来一个按比例缩小的集群,以支持交互式查询。我可以用BI工具使这些模型可供商店或分销经理使用。

问:Facebook的Prophet是季节性时间序列的一个很好的解决方案。非季节性时间序列呢?如何确定预测的准确性?

我同意Facebook的先知适用于季节性数据。与udf你可以使用华宇电脑以及其他通用库。你也可以试试RMSE以及其他方法来找出哪种更适合你。Prophet也有自己的工具来确定准确性。

在我们的博客文章中,Bilal演示的信息被仔细记录。在本文中,我们创建了第二个UDF,在其中计算评估指标。您可以使用任何数量的方法来评估这一点,并在查看预测结果时将它们带回考虑。

额外的零售/CPG和需求预测资源

免费试用Databricks
看到所有工程的博客的帖子