客户的故事

上下文大规模数字广告的数据和分析

2 x

降低基础设施成本

35 b +

每天事件处理分析

5倍

更快的数据管道

gumgum头
bob体育客户端下载平台用例:三角洲湖,数据科学,机器学习,ETL
:AWS

GumGum帮助营销人员更好的与他们的客户通过使用上下文消息传递服务的在线广告匹配他们正在查看的内容。确保这种级别的广告交付需要实时数据的见解,这是与EMR难以支持。今天,在一个统一的数据和机器学习方法由砖,GumGum能够加快响应时间,降低运营成本,实现新车型生产更多更快更有效率。

AI需要实时数据的见解进行优化

使机器能够“看到和理解”需要以接近实时的处理大量的数据。GumGum广告业务团队,例如,需要提取实时见解使关键业务决策成功的广告交付和性能。

正在寻找数据的见解,可以提高品牌的audience-buying战略与规划广告格局急剧变化很难提供准确的实时bidstream分析。超过350亿的大规模bidstream每天数据点,GumGum的业务团队不断寻找提高运动性能的实时bidstream见解。

当然,每天处理的数据集大小100多个数据管道运行24×7不是一个简单的命题——特别是当你没有正确的技术。砖之前,GumGum挣扎与AWS EMR计算密集型工作负载管理和Apache风暴,以及由此产生的无法自动扩展,现货实例分配、执行快速的数据分析,和跨团队协作。

“我们在数字广告业务这意味着我们的交通趋势变化很大从第一季度到第四季度,我们需要能够毫不费力地向上和向下扩展,“Rashmina Menon说,高级GumGum数据工程师。”,除了不同的流量趋势,我们作为一个公司,数据爆炸,我们需要能和我们成长的工具。”

GumGum数据工程团队,这样的增长意味着他们需要一个工具,使它容易访问数据和构建ETL管道。数据科学团队,他们需要规模数据探索和模型训练。数据分析师,他们需要访问时间表业务洞察力。

他们需要一个平台,促进全面合作更快更有效的bob体育客户端下载生产力和价值的转换。

统一的数据和人工智能能够提升团队协作和工作效率

自实施砖,GumGum已经能够迅速过渡分布式数据处理工作负载从Apache风暴(AWS EMR)火花流与全面管理计算集群,根据需要自动扩展。三角洲湖已经使他们能够构建具有成本效益的,可靠的,和快速查询性能,现在现货实例是用于所有工作负载,提高运营效率和降低成本。

“砖与三角洲湖不仅使我们能够实现更快的查询性能,但我们也能够使整个项目更具有成本效益的,”Jatinder Assi博士补充道,一个数据在GumGum工程经理。“三角洲缓存,我们的数据是完全存储在磁盘上,释放内存使用映射-规约模式操作。”

数据然后流下游数据科学家和分析师。数据科学家使用MLflow简化模型管理包括包装代码可重用性和创建一个多步模型评价管道提高部署。和分析师团队利用商业智能的集成美人做出更明智的决策。

至于协作,砖互动的笔记本带来了团队在一起。现在,他们可以共享数据分析工作和结果跨多个数据功能,并支持多种语言(Scala, Python、SQL、R)使得不同的工作负载和用户在数据工程,分析师和数据科学家船上来。

上上规模和性能,成本和停机时间

砖统一数据分析平台与三角洲湖使得GumGum团队加速他们的数据处理和bob体育客户端下载报告功能5 x同时降低基础设施成本,2 x。“今天我们的广告库存预测应用程序现在拥有响应时间不到30秒,“Menon说。“和我们交付性能成本优化的方式。”

与砖确保QA、发布和部署周期不仅更快,更高效和EMR以前管道相比,GumGum数据团队的能力有信心推动企业向前发展。

“砖已经给我们的成本优化和查询性能的完美的平衡,”Assi结束。“这使我们更快地构建和部署数据密集型工作负载和节省成本,进而让我们的卖家和关键业务涉众来驱动业务数据驱动的方式。”