客户的故事
上下文数字广告规模与数据和分析

工业:广告与营销技术

解决方案:广告效果客户细分多点触控广告属性

bob体育客户端下载平台用例:三角洲湖数据科学机器学习ETL

云:AWS

GumGum帮助营销人员更好地与他们的客户进行互动,通过使用上下文消息传递来提供广告,以匹配他们在线观看的内容。确保这种级别的广告投放需要实时数据洞察,而EMR很难支持这一点。如今,通过Databricks提供的数据和机器学习统一方法,GumGum能够加快响应时间,降低运营成本,并更快速有效地将新模型交付生产。

人工智能需要实时数据洞察才能实现最佳表现

让机器能够“看到并理解”,需要以近乎实时的方式处理大量数据。例如,GumGum的广告业务团队需要提取实时数据,为成功的广告投放和表现做出关键的商业决策。

随着快速变化的程序化广告格局,对数据洞察的持续寻找,可以改善品牌的受众购买策略,这使得很难提供准确的实时投标流分析。凭借每天超过350亿投标流数据点的庞大规模,GumGum的业务团队不断寻找实时投标流洞察,以提高活动绩效。

当然,每天通过运行24×7的100多个数据管道处理如此大的数据集并不是一件容易的事情——特别是当您没有合适的技术时。在Databricks之前,GumGum一直在用AWS EMR和Apache Storm管理计算密集型工作负载,导致无法自动扩展、发现实例分配、执行快速数据分析和跨团队协作。

GumGum高级数据工程师Rashmina Menon表示:“我们从事的是数字广告业务,这意味着我们的流量趋势在第一季度和第四季度之间变化很大,所以我们需要能够轻松地扩大和缩小规模。“除了不同的流量趋势之外,我们作为一家公司正在成长,数据正在爆炸式增长,我们需要能够与我们一起成长的工具。”

对于GumGum的数据工程团队来说,这种增长意味着他们需要一种工具,可以方便地访问数据并建立ETL管道。对于数据科学团队来说,他们需要扩展数据探索和模型训练。对于数据分析师来说,他们需要获得时间轴业务洞察力。

他们需要一个单一的平台,以促进全面协作,提bob体育客户端下载高效率,加快实现价值的时间。

统一数据和人工智能可以提高团队协作和生产力

自从实现Databricks以来,GumGum已经能够快速地将分布式数据处理工作负载从Apache Storm(和AWS EMR)转换到Spark Streaming,并具有完全托管的计算集群,可以根据需要自动扩展。Delta Lake使他们能够构建具有成本效益、可靠且快速的查询性能,并且现在在所有工作负载上使用现货实例,以提高操作效率并降低成本。

GumGum的数据工程经理Jatinder Assi补充说:“Delta Lake的Databricks不仅使我们能够实现更快的查询性能,而且我们还能够使整个项目更具成本效益。”“使用Delta缓存,我们的数据完全存储在磁盘上,从而释放内存用于映射-减少操作。”

然后,数据流向下游的数据科学家和分析师。数据科学家使用MLflow来简化模型管理,包括打包代码以实现可重用性,以及创建多步骤模型评估管道以改进部署。分析团队利用与Looker的集成来获得商业智能,从而做出更明智的决策。

在合作方面,Databricks的交互式笔记本电脑将团队在很大程度上团结在一起。现在,他们可以跨多个数据函数共享数据分析工作和结果,并且支持多种语言(Scala、Python、SQL、R),这使得跨数据工程、分析师和数据科学家的不同工作负载和用户也可以加入进来。

提高规模和性能,降低成本和停机时间

Databricks与Delta Lake的统一数据分析平台使Gumbob体育客户端下载Gum团队的数据处理和报告能力提高了5倍,同时将基础设施成本降低了2倍。“现在我们的广告库存预测应用程序的响应时间不到30秒,”Menon说。我们正在以成本优化的方式实现这一性能。”

与之前的EMR管道相比,Databricks确保QA、发布和部署周期不仅更快,而且更具成本效益,GumGum数据团队对他们推动业务向前发展的能力充满信心。

Assi总结道:“Databricks为我们提供了成本优化和查询性能的完美平衡。“它使我们能够更快、更经济地构建和部署数据密集型工作负载,从而使我们的卖家和主要业务利益相关者能够以数据驱动的方式推动业务。”

  • 2 x
    基础设施成本降低2倍
  • 35 b +
    每天处理的事件用于分析
  • 5倍
    更快的数据管道

Databricks是我们快速试验和快速扩展的关键因素——这就是平台如何为业务增加价值并帮助我们增长的原因。”bob体育客户端下载

- Atif Ahmed, RB高级分析总监

相关内容

2020年Spark + AI峰会技术讲座