扎克默斯格雷夫

牵头工程师Yelp

bob体育客户端下载扎克默斯格雷夫是叶尔普计量基础设施团队的首席工程师,为叶尔普工程操作团队提供仪表、监控、报警和数据平台自研究生院起,Zach一直以性能优化方式工作:从单个系统代码路径到千家机广服务性能集群叶尔普市还从事大规模部署基础建设 新奇缓存层 hadoop运维和密钥管理回到过去 扎克主修英语

上几届会议

峰会2019 云存储spring清洗:宝藏狩猎

4月24日20195: 00PMPT

尝试判定保留数据、归档数据或删除数据Yelp使用spark和Parquet从数据存取中提取实战商业价值通过深入了解API响应层次的数据,我们可以启动新举措,环绕右侧层次、安全审核和出处近十年来 Yelp积聚亚马逊S3内数据小节分类和判断对组织的价值像跳蚤市场自然,有些盘点无价,但大多数新时值微弱,现在零值零保留费用昂贵,审计不可能,分析比窃取独立宣言更难偶然发现叶尔浦最贵数据归档存取日志

据我们了解,没有人分析过这些小东西,因为桶内装着数以百万计的小物体。Spark处理难因s3行为:通常Spark驱动程序在此假想中耗尽内存继续打猎时,我们创建了新式解决办法,它从Jupyter笔记本开始先处理键名-而不是使用SparkHDFS抽象化-我们用RDD转换数据并编译成数据框并转换成Apache Parque从那里,我们保存S3数据湖

协议概述设计 分享配置 点出几个陷阱 并端端 应用结果使用安全 记账整理学管库每一个新机器学习模型-和每个新产品特征-创建数十个中间数据模型和成千文件填充通常无用日志调试数据通过出席我们的会议,你将学习管理贵组织的数据无序扩展使用我们的量化循证方法