跳转到主要内容

开始使用三角洲湖

使Apache火花与三角洲湖更好

    系列的细节

    这次会议是开始的一部分与三角洲湖系列丹尼李和三角洲湖团队。

    会议摘要

    Michael时常要加入三角洲湖工程团队的负责人,了解他的团队建立在Apache火花带来ACID事务和其他数据可靠性技术从数据仓库世界湖泊云数据。

    Apache火花是占主导地位的大数据的处理框架。三角洲湖增加了可靠性引发你的分析和机器学习计划准备访问质量,可靠的数据。这个网络研讨会涵盖三角洲湖的使用引发环境来提高数据的可靠性。

    主题领域包括:

    • Apache火花在大数据处理的作用
    • 使用数据湖泊作为数据架构的一个重要组成部分
    • 数据可靠性挑战湖
    • 三角洲湖如何帮助为电火花加工提供可靠的数据吗
    • 具体改进改进,三角洲湖补充道
    • 易于采用湖三角洲湖驱动你的数据

    你需要什么:
    报名参加Community Edition在这里和访问车间演示材料和样本的笔记本

    迈克尔Armbrust剖面图像

    迈克尔。首席软件工程师砖
    迈克尔时常要提交者和PMC成员Apache的火花,火花的原始创造者SQL。他在砖目前领导团队,设计并建造了结构化流和砖三角洲。他在2013年获得加州大学伯克利分校的博士学位,并建议由迈克尔·富兰克林,大卫·帕特森,阿曼德狐狸。他的论文侧重于建立系统,使开发人员能够快速构建可伸缩的交互式应用程序,特别是规模独立的概念定义。他的兴趣广泛包括分布式系统、大规模结构化存储和查询优化。

    视频记录

    ——(丹尼)嗨,每一个人。欢迎来到我们今天的研讨会,与三角洲湖使Apache火花更好。

    在我们开始今天的演讲之前,我们想去一些管家的东西,确保你有最好的体验。请注意,您的音频连接将柔和的网络研讨会的看每个人的安慰。如果你有任何问题或疑问,请提出这些问题的问题小组或聊天。在面板我们鼓励你利用这段时间问尽可能多的问题和澄清任何怀疑你可能在今天的主题。我们今天的主要主持人迈克尔Armbrust,最初的创造者火花SQL和结构化流,和三角洲湖的主要创造者之一。他是首席工程师的砖,所以没有任何进一步的延迟,迈克尔把它拿走。——(Michael)谢谢你,丹尼。今天我超级兴奋,谈论如何使Apache火花更好使用三角洲湖。然而,我跳进之前,我想先讨论这个概念数据湖和为什么这么多人感到兴奋,为什么有很多的挑战当他们试图设置这些东西。