迈克Vedomske

PetSmart的高级数据科学家

    Mike Vedomske是PetSmart高级分析小组的高级数据科学家。PetSmart总部位于美国亚利桑那州凤凰城,是全球最大的专业宠物零售商,为宠物提供终身需求的服务和解决方案。在PetSmart之前,Mike在创业公司和国防承包商的世界中工作,将各种建模技术应用于美国医疗保健系统、营销、网络安全、物联网、关键基础设施保护、欺诈、医疗信息学等各种问题。Mike是美国国家科学基金会研究生研究员,并在弗吉尼亚大学系统工程系获得博士学位。

    过去的会议

    PetSmart在北美拥有1600多家门店,是最大的专业宠物零售商,为宠物提供终身需求的服务和解决方案。高级分析小组是一个由高度面向业务的战略和数据科学专业人员组成的小团队,他们使用各种数据和建模方法,为整个公司的各个业务部门提供突破性的见解,从而为PetSmart提供收入和利润增长。

    作为一家零售商,PetSmart拥有多年的交易数据、防损商店报告、客户反馈、劳动时间表、供应链和其他数据。损失预防涉及减少可预防的损失,无论是来自盗窃、欺诈、破坏、浪费、滥用、事件、事故或不当行为。

    PetSmart门店负责人向损失预防调查团队提交免费文本报告,这些报告必须优先进行进一步解决。大多数报告的优先级较低,并作为政策履行的问题进行报告,但有些报告需要本小组进一步调查。但是,团队仍然必须阅读每个报告,以便过滤出低优先级的报告,然后花时间调查高优先级的报告。高级分析组被问及我们是否可以帮助自动对这些报告进行优先排序。开发一个性能高到足以自动排序的优先级系统需要接近人类的性能。为了达到这个水平(96%的准确率),我们使用了FastAI的ULMFiT NLP分类器。

    Azure Databricks不支持FastAI,因此设置需要特殊配置。Azure Databricks新发布的ML Beta和GPU集群在启用该设置方面发挥了重要作用。其他挑战包括从遗留报告系统中实际提取数据。如果没有Azure Databricks提供的灵活性,模型的迭代、训练和最终操作化将花费更长的时间和更大的成本。