吉姆活力四射

产品分析与行为科学团队领导,康卡斯特

    吉姆活力四射的产品分析和行为科学(绝压)团队的技术、产品和经验组织在康卡斯特负责将比特的数据转换为消耗品,富有成效的见解。吉姆的一天挑战数据管道,研发新的想法,关键指标和通知数据驱动决策。康卡斯特之前,吉姆领导数据科学团队的财富500强企业管理咨询公司。他专门从事大规模的产品分析,云平台、用户行为研究和保留对新产品计划的建模。bob体育客户端下载

    过去的会议

    2020年峰会 大规模数据驱动决策

    2020年6月23日凌晨5点PT

    康卡斯特公司是美国最大的有线电视和互联网服务提供商,达到3000万多个客户,持续增长的收购其在欧盟的天空。在过去的几年,Comcast将重点转向了客户体验。例如,康卡斯特推出我们的Flex设备为客户可以直接将内容传输到电视不需要额外的有线电视订阅。焦点转移到客户体验,康卡斯特作出一致努力,继续数据驱动决策了解顾客与我们的产品同时继续创新与新产品和订阅。产品分析与行为科学(绝压)团队起着至关重要的作用作为一个解释器,将数据转换成可消费的洞察力和更广泛的产品团队提供这些见解在康卡斯特。绝压的团队,这对整个产品生态系统包括X1, Flex XFi和全新的设备,这是世界上最大的流媒体平台之一,这个生态系统负责生成数据的速度超过25 tbs每天超过3 pbs的数据被用于消费品的见解。bob体育客户端下载为了绝压团队能够继续推动消费品的见解在大规模数据集,同时仍然能够控制存储的数据量,绝压团队一直使用砖和砖三角洲湖大电流低延迟读/写为了构建可靠的实时数据管道提供见解,也能有效及时删除。从三角洲的一些特性,我们利用来实现所需的水平的效率,优化和节约成本是:

    • 分布式写入s3(本质上消除500错误)
    • 优化

    “康卡斯特公司是美国最大的有线电视和互联网服务提供商,达到超过3000万的客户。在过去的几年,康卡斯特使用机器学习已经改变了客户体验。例如,康卡斯特使用机器学习能力X1声音遥远,这是使用/ 8 b * 2018年由我们的客户找到他们喜欢看的东西,了解最新的体育统计,控制他们的家,或检查他们的比尔和解决他们的服务使用自然语言。

    所有这些不同的应用程序都有一个共同点,那就是创建和操作机器学习模型驱动这些应用程序,我们需要每天摄取许多TBs的数据在一个有效的和有弹性的方式,和需要一个机器学习的平台,允许快速探索新思路,同时生成的机器学习模型的自动部署到生产环境中,可以处理康卡斯特的规模。bob体育客户端下载

    在这次演讲我们描述我们的数据和机器学习的基础设施建在砖统一分析平台包括如何使用砖三角洲的摄取和初步处理的原始遥测从我们的视频和语音应用程序和设备。bob体育亚洲版bob体育客户端下载然后我们解释如何使用这些数据的产品组织获得更深的洞察我们的产品是如何被使用的,以及我们的研究和工程团队训练和燃料的机器学习模型的核心产品。这个主题还包括一个端到端的展示我们的机器学习的平台,是围绕着砖和MLFlow以及它如何与其他开源集成机器学习框架,如Tensorflow PyTorch, Skleabob体育客户端下载rn、净水和Kubeflow等等。”bob下载地址

    2019年峰会 建筑Sessionization管道与砖三角洲的规模

    2019年4月24日凌晨5点PT

    康卡斯特作出一致努力,把自身从一个电缆/ ISP技术公司。数据驱动的决策是这一转变的核心,我们用数据来了解顾客与我们的产品,和我们看到的数据是最真实的代表我们的客户的声音。我的团队、产品分析和行为科学(绝压)团队扮演角色解释器,将数据转换成可消费的见解。

    X1娱乐操作系统,是世界上最大的视频平台,和我们的客户消费超过十亿小时的内容X1上一个星期。bob体育客户端下载我们的团队消耗X1遥测的速度超过25 tbs每天的数据,并使用这些数据告知我们的产品团队成员的业绩和参与的平台。bob体育客户端下载我们也使用这些数据来研究客户行为来帮助我们更好的了解产品团队成员机会的领域我们的产品,包括创建新功能的修复bug。

    这些见解,我们需要有一个可靠的实时数据管道提供这些信息,我们需要我们的数据科学家和工程师能够迅速和有效地能够开发并提交新代码,以确保我们可以测量产品团队正在开发新特性。在这种规模的环境中,我们已经使用砖和砖δ获得操作效率,优化和节约成本。

    从三角洲的一些特性,我们利用来实现所需的水平的效率,优化和节约成本是:

    ·分布式写入s3(本质上消除500错误)

    ·s3与快速读取和ACID事务日志(在s3中大规模增加扫描/读取,使桶的一致视图/表)

    ·真空

    ·Pptimize(让我们减少到40 640节点工作,和大大提高效率我们的集群以及DS /德)