减少数据存储从传统数据库
45分钟来优化招标,低于7.5小时
四分位数面临挑战,存储和处理数据的多个广告通道由于关键需求报告和巩固销售数据,包括超过60天的归因。之前的架构无法跟上数据四分位数的大小处理。团队在10 tb的数据在一个批处理工作,应用转换所需的所有数据报告,导致服务器不可用,晚交货的数据点。这个过程,负责改善性能的广告,有严重的性能问题,如个人工作运行7.5小时每天。
作为公司的发展的一部分,四分位数的成熟数据架构已达到了新的水平,增长从传统的SQL数据库运行在Azure云与砖Lakehouse为基础的新的解决方案。这几个地区的现代化已经直接影响公司和四分位数的客户明显的好处:与三角洲湖有更多的数据可靠性、更快的性能和降低成本。当数据从一个传统的SQL数据库迁移到砖,他们看到一个相当大的数据量的减少,主要是由于δ的优化版本控制和拼花压实,导致减少存储从90年结核病大约18结核病。
lakehouse架构使得四分位数的数据堆栈进化。这是通过几个过程:利用砖汽车装载机的增量和高效处理的新数据文件到云存储;通过使用三角洲湖的开放格式存储层,提供可靠性,安全性和性能数据湖;通过使用砖SQL,继续拉近工程师和数据分析师易于构建的查询和仪表板;砖工作流,连接所有的碎片在一个稳定的和可扩展的方式。
为顾客提供最好的体验,四分位数需要能够获取准确的数据。这是一个重要的挑战,更容易引发用户定义函数,处理公司使用并行性的力量来处理分解成尽可能多的部分。为他们解决,他们利用起程拓殖部署所有的工作区,容易纺丝新集群和就业以及确保正确的标准是被跟踪整个公司。
关键是四分位数的客户有一个集中的解决方案,他们可以分析他们的销售,成本和其他指标相关的活动。在四分位数,他们利用可靠的数据工程和集成数据砖与权力BI直接嵌入仪表板的门户。这有助于为客户提供一个地方都配置跨几个渠道营销活动以及跟踪性能变化的同时仍然维持一个较小的内存数据存储便宜80%相比,传统的数据仓库中存储的数据通过利用三角洲湖对对象存储的文件格式。的能力组合来自不同渠道数据已经帮助一些顾客,,作为一个例子,因为他们与四分位数增长超过100%。
但这还不是全部。四分位数也为提高专利算法性能的广告,利用机器学习角色实现的砖。的能力有一个中央lakehouse平台来构建他们的整个数据堆栈使四分位数的开发者更简bob体育客户端下载单的生活,使他们能够专注于开发创新解决方案,为客户带来越来越多的更好的结果。作为另一个例子,OfficeSupply有极好的结果在他们的第一年处理四分位数时,谷歌的广告收入增长67%,增长103%,谷歌购物点击商标条款通过改善性能的个人工作——但现在他们使用7.5小时在45分钟lakehouse平台上运行。bob体育客户端下载
展望未来,四分位数继续与砖合作建立现代数据堆栈、集成和测试新的解决方案。这包括三角洲住高等数据质量检查表,δ分享给客户自己的数据和市场数据,使客户迅速开始。四分位数有一个大胆的目标发展的第一个横渡英吉利海峡的学习一个广告在这个空间,优化算法和砖将这些创新的中心。