Hotels.com主机数百万325000 +酒店在网站上的照片。每天数以千计的新属性和客户上传的照片都是一样的。这些照片需要快速分析,以避免重复和低质量的图像,然后分类(如厨房、游泳池、健身房),这样他们就可以进行逻辑排序。最后,当客户搜索网站,酒店需要个性化的建议帮助客户找到完美的酒店对他们的需求。实现这一需要巨大的计算能力和先进的分析方法。
利用机器学习来驱动消费者经验:海量图像文件对应于每个属性清单包括重复和缺乏组织的排名和分类。需要构建实时得分和成为更有效的机器学习/深度学习模型部署到生产环境中。
建立一个更健壮的和更快的数据管道:前提Hadoop集群上使用SQL和SAS数据科学规模缓慢和限制——花2个小时处理数据管道只有10%的数据。
增加客户转换:能够理解客户的实时趋势发展策略驱动转换和生命周期价值。
砖帮助Hotels.com实现成为“数据科学关注的目标,这样他们就可以预测客户行为和提供更优化用户体验。
集群管理:可以扩展的数据量大大不增加基础设施的复杂性。
互动工作区:促进文化之间的协作数据科学团队在Hotels.com以及其他业务单位在Expedia。
砖运行时:提高处理性能的流数据即使在规模。
——马特·弗莱尔副总裁,首席数据科学,Hotels.com