Wehkamp是使用传统的企业数据仓库,但随着其业务的增长,它无法规模没有密集的DevOps的支持正在放缓下来。此外,遗留系统没有协作,建立筒仓只有他们的数据分析师能够访问数据,其中大部分是未使用的由于数据竖井带来的挑战。这都有一个累积效应不仅与机器学习创新能力,但当他们构建新的功能,他们无法规模在全球网站在他们的业务需要。
大量的数据:数据生成的500000名游客和400000产品每一天。
规模数据竖井和无法规模:难以操作支持数据科学的努力对大量的数据,由于数据竖井和传统的数据仓库环境。因此,time-to-insight低于他们需要在各种驱动创新全球网站。
低效率的机器学习:无法比例模型构建和训练,以满足业务需求。
缓慢的上市时间:构建新功能是缓慢的,带他们一年多从构思到生产——阻碍他们能够快速的规模地区成功跨越全球的网站。
砖Wehkamp提供了一个统一的数据分析平台,培养了协作和民主的环境在整个公司,使他们能够摄取大量的高速数据,并开发bob体育客户端下载一个强大的图像分类和推荐引擎来改善客户体验。
完全在AWS管理平台:自动化bob体育客户端下载集群管理简化基础设施在任何规模和操作。
更高效的数据流:能够轻松地与其他工具集成如气流和Kubernetes,允许他们构建自动化数据管道,同时建立CI / CD最佳实践。
改善跨团队协作:协作笔记本环境支持多种语言(SQL, Scala, Python, R)允许用户多样化的团队一起工作在他们的首选语言允许他们加速数据科学操作和创新。
流线型的ML生命周期:本机支持MLflow使数据科学团队轻松地复制实验,跟踪模型的性能,并迅速以系统化的方式在他们的模型进行迭代。
砖,任何人在Wehkamp可以很容易地访问数据,与其他服务和集成工作,显示更多的利用这些数据。机器学习用例提供了巨大的价值,直接影响收入。
改进的数据团队的生产力:数据分析人士、科学家和工程师一起工作和有效率,Wehkamp打破了数据仓库,使其更容易使用的数据。Wehkamp使他们所有的分析师使用砖和表来分析他们的数据和驱动更好的业务决策。
提高运营效率:特性,比如伸缩集群和MLflow改善了操作机器学习从数据摄取到管理整个生命周期——允许他们构建和训练每天成百上千的模型。此外,Wehkamp使用消费表数据直接从三角洲湖砖上运行,使分析师更容易想象他们的整个数据湖。
减少运营成本:从Hadoop过渡到砖,减少运营成本的70%左右。
更多的数据科学创新:自动显示与图像分类的产品和为客户更个性化的购物体验。提供10个不同的建议在规模和增加客户参与更多的个性化内容和最终2 x的收入。
Wehkamp三角洲湖的数据分析师利用数据以供自助服务报告和仪表板通过画面,提供见解,帮助减轻业务风险和推动智能业务决策。