尼尔森

客户案例研究

尼尔森

尼尔森是一家全球领先的信息和测量公司,提供关于人们观看,收听和购买的市场研究,见解和数据。

垂直用例

垂直用例:数字化转型——使他们的技术基础设施现代化,这样他们就可以大规模地进行大数据和机器学习。

技术用例

  • 数据摄取和ETL
  • 流媒体
  • 机器学习
  • 深度学习

的挑战

  • 他们无法在一台机器上处理和分析需要为下游分析做好准备的大量数据。
  • 遗留的基础设施无法处理大量的数据。他们没有合适的工具,这使得访问、准备和分析非常麻烦。
  • 缺乏Apache Spark专业知识——他们的大多数数据科学家都精通传统技术(SAS和Netezza),没有能力利用Spark的强大功能。
  • 努力访问遍布全球不同系统的数据。
  • 由于遗留系统的复杂性,从研发到部署到生产的周期太长了(即必须重写部署代码,导致错误)。

解决方案

Databricks为尼尔森提供了一个统一的分析平台,作为其构建人工智bob体育亚洲版能优先战略的核心基础。bob体育客户端下载

  • 高度可扩展、完全管理的多云服务(AWS和Azure),将数据工程和数据科学统一在一个平台上。bob体育客户端下载
  • 自动化集群管理简化了任何规模的集群供应。
  • 支持多种语言(SQL, Scala, Python, R),确保所有团队成员在协作笔记本环境中高效工作。
  • 来自物联网设备的批处理数据集和实时流数据的统一,使他们能够跨两种工作负载重用代码,这大大减少了数据工程的工作量。
  • 集成关键的深度学习框架和库,如TensorFlow, Keras和Pytorch。

结果

数据库推动了尼尔森文化的重生。就团队如何合作以及如何完成工作而言,已经发生了巨大的转变。跨团队的协作极大地提高了性能、速度和规模,最终导致创新。

Databricks是我们人工智能战略的重要组成部分。随着我们继续将业务数字化,并通过人工智能和机器学习探索机遇和挑战,我们将继续在其余业务中激活Databricks。

Mainak Mazumdar,尼尔森首席研究官