耿军杜

首席架构师,腾讯

    耿军Du是腾讯云大数据部门和首席架构师负责云数据仓库工程团队。作为Apache Hadoop提交者/ PMC成员,他是Hadoop 2.6的发布经理。2.8 x和。x社区。耿军十多年行业经验大数据和云区域。在加入腾讯之前,他是纱在Hortonworks团队领导。Hortonworks之前,他担任技术主管vHadoop在VMware和大数据扩展。

    过去的会议

    2020年峰会 三角洲湖的全面比较,冰山和Hudi

    2020年6月23日凌晨5点PT

    最近,一组现代三角洲湖等表的格式,Hudi,冰山的春天。连同蜂巢Metastore这些表格格式正试图解决问题,站在传统数据湖很长一段时间和他们宣布特性,如酸、模式演化,插入,时间旅行,增量消费等。这个演讲将分享比较的研究,我们对关键特性和设计这些表格格式,成熟的特性,比如api暴露终端用户,如何使用计算引擎,最后综合指标对事务,插入和质量分区将共享引用观众。