客户的故事

用语音、数据和人工智能改变家庭娱乐

10倍

降低处理数据的总体计算成本

90%

减少管理基础设施所需的DevOps资源

工业:媒体娱乐

解决方案:客户细分

bob体育客户端下载平台用例:三角洲湖数据科学机器学习ETL

云:AWS

“Databricks帮助康卡斯特每天处理数十亿笔交易和tb级的数据。”

——康卡斯特机器学习副总裁Jan Neumann

背景图像

作为一家将数百万客户连接到个性化体验的全球技术和媒体公司,康卡斯特一直在海量数据、脆弱的数据管道和糟糕的数据科学协作方面苦苦挣扎。借助Delta Lake和MLflow等Databricks,他们可以为千兆字节的数据构建性能数据管道,并轻松管理100多个模型的生命周期,使用语音识别和机器学习创建高度创新、独特和获奖的观众体验。

基础设施无法支持数据和机器学习需求

即时回答客户对特定节目的语音请求,同时将数十亿次个人互动转化为可操作的见解,这让康卡斯特的IT基础设施、数据分析和数据科学团队感到紧张。让事情变得更复杂的是,康卡斯特需要将模型部署到一个脱节的、完全不同的环境中:云、现场,甚至在某些情况下直接部署到设备上。

  • 海量数据:我们的娱乐系统产生了数十亿个事件,2000多万个语音遥控器产生了pb级的数据,需要进行会话分析。
  • 脆弱的管道:复杂的数据管道,经常发生故障,很难恢复。小文件难以管理,减缓了下游机器学习的数据摄取。
  • 协作不佳:全球分散的数据科学家使用不同的脚本语言工作,难以共享和重用代码。
  • ML模型的管理:开发、培训和部署100多个模型是高度人工的、缓慢的、难以复制的,因此难以扩展。
  • 开发和部署之间的摩擦:开发团队希望使用最新的工具和模型,而运维团队希望在经过验证的基础设施上进行部署。

自动化的基础设施,更快的数据管道与三角洲湖

康卡斯特意识到,他们需要对整个分析方法进行现代化改造,从数据摄取到机器学习模型的部署,以提供令客户满意的新功能。如今,Databricks Lakehouse平台使康卡斯特能够bob体育客户端下载构建丰富的数据集,大规模优化机器学习,简化跨团队的工作流程,促进协作,降低基础设施的复杂性,并提供卓越的客户体验。

  • 简化基础设施管理:通过自动化集群管理和成本管理功能(如自动伸缩和现货实例)降低运营成本。
  • Delta Lake的性能数据管道:Delta Lake用于对来自视频和语音应用程序和设备的原始遥测数据进行摄取、数据丰富和初始处理。
  • 可靠地管理小文件:Delta Lake使他们能够优化文件,快速可靠地大规模摄取。
  • 协作工作空间:交互式笔记本提高了跨团队协作和数据科学创造力,允许康卡斯特大大加快模型原型的迭代速度。
  • 简化的ML生命周期:托管MLflow简化了机器学习生命周期和通过Kubeflow环境提供的模型服务,允许他们轻松跟踪和管理100多个模型。
  • 大规模可靠的ETL: Delta Lake提供大规模高效的分析管道,可以可靠地连接历史数据和流数据,以获得更丰富的见解。
  • 康卡斯特还使用Tableau为分析师提供数据,为客户分析提供更广泛的数据集,而且速度很快。
康卡斯特视频缩略图

故事背后:数据团队效应

来见见康卡斯特背后伟大的数据团队吧

现在看→

使用ML提供个性化体验

在竞争激烈的娱乐行业,没有时间按下暂停键。有了统一的分析方法,康卡斯特现在可以快速进入人工智能驱动的娱乐的未来——让观众沉浸在竞争中胜出的客户体验中,并感到高兴。

  • 艾美奖获奖观众体验:Databricks帮助康卡斯特通过智能语音命令创造了高度创新和获奖的观众体验,提高了参与度
  • 降低计算成本10倍:Delta Lake使康卡斯特能够优化数据摄取,在提高性能的同时将640台机器替换为64台。团队可以花更多的时间在分析上,而花更少的时间在基础设施管理上。
  • devops:将200个用户所需的全职devops员工数量从5个减少到0.5个。
  • 更高的数据科学生产力:通过单一的交互式工作空间支持不同的编程语言,促进全球数据科学家之间的合作。此外,Delta Lake还使数据团队能够在数据管道中的任何位置使用数据,使他们能够更快地构建和训练新模型。
  • 更快的模型部署:将部署时间从几周缩短到几分钟,因为运维团队将模型部署在不同的平台上bob体育客户端下载