工程的博客

大规模按需网络研讨会:细粒度的需求预测

分享这篇文章

我们最近举办了一个研讨会——生活星巴克如何预测需求规模与Facebook先知和砖吗——在这个网络研讨会我们学到了为什么需求预测是至关重要的零售/ CPG公司以及它如何使其他22个用例。数据科学经理Brendan O ' shaughnessy星巴克走我们通过星巴克如何大规模需求预测。我们也做了一个逐步演示如何执行细粒度的需求预测一天/存储/ SKU水平砖和Facebook的先知

民主化与砖的金融时间序列分析。

幻灯片的研讨会可以在这里

为什么细粒度的需求预测和星巴克如何吗?

执行细粒度预测day-store-SKU超出传统的能力,基于数据仓库的预测工具。对产品不同的产品的需求,存储和天,然而传统的需求预测解决方案执行他们的预测综合市场,周和推广组水平。

通过引入砖统一数据分析平台,零售商们能够看到两位数的改进预测精度。bob体育客户端下载他们可以执行细粒度预测SKU,存储和天以及包括数以百计的附加功能来提高模型的准确性。他们可以进一步加强他们的预测与定位和简单的包含额外的数据集。他们这些预测的日常运行,为他们的规划者和零售业务团队提供及时的数据更好的执行。

在这个网络研讨会,我们回顾:

  • 如何执行细粒度的需求预测一天/商店/ SKU与砖吗
  • 如何准确地预测时间序列数据,使用Facebook的先知
  • 同时,如何星巴克相对轻松地定制的预测吗
  • 如何培养大量的使用事实上的分布式数据处理引擎模型,Apache火花™
  • 最后,我们提出了这个数据分析师和管理人员使用BI工具使驱动所需的决策所需的业务成果

在研讨会结束后,我们举行了问答。下面是问题和答案:

问:你什么模型版本控制技术应用于展示模型随着时间的推移被提高?

我们的许多客户使用MLflow跟踪他们的实验。他们可以使用MLflow跟踪各种参数与这些模型和比较各模型的性能指标。这有助于跟踪改进以及图书馆他们使用画的见解。MLflow帮助把这些模型从实验到生产速度更快。

问:为什么使用udf来代替MLlib吗?这是为了访问吗SciKit学模型?

我们使用的是udf所以我们可以灵活地利用任意数量的图书馆。Facebook的先知现在很流行,但有许多图书馆我们可以用时间序列。有些人比其他人更合适的在某些场景中。我们通过使用udf,得到最终的灵活性,同时利用并行化。

问:如何三角洲湖帮需求预测吗?

周围有很多问题如果我要大,这要花我多少钱?我们显然想做的一件事就是利用云计算和利用这些资源,运行我们的预测大规模尽可能快速和积极。当我们想要释放这些资源云提供商,我们不支付。当我这样做,我和我的预测是什么呢?我不想失去我画的见解运行模型。这些结果是在一个数据帧最终,这意味着它们驻留在内存中。所以我们要做的是,我们坚持这些数据并存储它。我们的首选格式是三角洲湖三角洲湖会让我很快就与这个数据交互和打开一个表。通过持久化数据,我现在可以选择把缩小集群数据,允许交互式查询。我可以使用BI工具使这些模型可用于储存或销售经理。

问:Facebook的先知季节性时间序列是一个很好的解决方案。长期时间序列呢?预测的准确性是如何被确定的?

我同意Facebook的先知能够很好地与季节的数据。与udf您可以使用华宇电脑和其他公共库。你也可以尝试RMSE和其他技术来找出哪些工作更适合你。先知有自己的工具来确定精度。

在我们的博客,Bilal演示仔细记录的信息。的帖子,我们创建第二个UDF,计算评价指标。您可以使用任意数量的方法来评估这个并且考虑当你带回来看看你的预测结果。

额外的零售/ CPG和需求预测资源

免费试着砖
看到所有工程的博客的帖子