三角洲湖数据摄取演示

免费开始

背景图像

使用Databricks Auto Loader,一旦新的批处理和实时流数据文件到达您的数据湖,您就可以增量地、高效地将它们吸收到Delta Lake表中,以便它们始终包含可用的最完整和最新的数据。Auto Loader是一个简单、灵活的工具,可以连续运行,或在“triggerOnce”模式下批量处理数据。SQL用户可以使用简单的“COPY INTO”命令自动将新数据拉入他们的Delta Lake表,而不需要跟踪哪些文件已经被处理。

见完整的演示列表→

下载笔记本

笔记本# 1笔记本# 2

深入了解Databricks平台bob体育客户端下载

视频记录

用自动装载机把数据输入德尔塔湖

将原始数据加载到数据仓库中可能是一个混乱而复杂的过程,但是使用Databricks,用可用的最新数据填充Delta Lake变得从未如此简单。

在这里,我们正在使用来自物联网设备(如跟踪步骤的智能手表)的一些JSON遥测数据。每5秒就有新的数据文件进入我们的数据湖,所以我们需要一种方法来自动将它们吸收到Delta lake中。Auto Loader提供了一个名为“cloudFiles”的新的结构化流数据源,我们可以使用它来实现这一点。

回归顶层→

背景图像

免费试用Databricks 14天

点击“免费开始”,即表示您同意隐私政策而且服务条款

准备开始了吗?