潜入三角洲湖

科技讲座系列

概述

加入我们的三部分学习系列:潜入三角洲湖。这一系列的技术讲座将带您了解Delta Lake的内部原理,Delta Lake是一种流行的开源技术,可以在您的数据湖之上实现ACID事务、时间旅行、模式强制等。bob下载地址三角洲湖工程团队,包括Burak Yavuz, Andrea Neumann, Tathagata“TD”Das和开发者倡导者Denny Lee是这次潜水的导游。

许多研讨会都有笔记本和幻灯片链接供你下载。

请跟我来注册您的免费社区版帐户下载Delta Lake图书馆

刚刚开始?查看我们的与三角洲湖技术谈话系列开始

解压事务日志

事务日志是理解Delta Lake的关键,因为它是贯穿其许多最重要特性的公共线程,包括ACID事务、可伸缩元数据处理、时间旅行等等。在本节课中,我们将探讨Delta Lake事务日志是什么,它如何在文件级别上工作,以及它如何为多个并发读写问题提供一个优雅的解决方案。

加强和发展模式

随着业务问题和需求的发展,数据结构也在不断变化。对于Delta Lake,随着数据的变化,合并新的维度是很容易的。用户可以访问简单的语义来控制他们表的模式,包括强制和演变。

DML内部:删除,更新,合并

在本节课中,我们将深入讨论在执行删除、更新、合并和结构化流时,提交、快照隔离以及分区和文件如何更改。

刚刚开始?

本系列技术讲座教程将带您了解Delta Lake (Apache Spark)的技术基础,以及Delta Lake为云数据湖添加的功能。

看现在