从三角洲湖开始

利用Delta Lake和MLflow为数据科学做好准备

丹尼·李。Databricks的开发者倡导者
Denny Lee是Databricks的开发者倡导者。他是一名实干的分布式系统和数据科学工程师,在为内部部署和云环境开发互联网规模的基础设施、数据平台和预测分析系统方面拥有丰富的经验。bob体育客户端下载他还拥有俄勒冈健康与科学大学(Oregon Health and Sciences University)的生物医学信息学硕士学位,并为企业医疗保健客户构建和实现了强大的数据解决方案。

系列的细节

本次会议是丹尼·李(Denny Lee)和三角洲湖团队“三角洲湖入门”系列的一部分。

会议摘要

在规划数据科学计划时,必须对整个数据分析领域有一个整体的看法。数据工程是数据科学的关键推动者,有助于及时提供可靠、高质量的数据。Delta Lake是一种为数据湖带来可靠性的开源存储层,可以帮助您将数据可靠性提升到一个新的水平。

在本节课中,您将学习:

  • 数据科学生命周期
  • 数据工程对于成功的数据科学的重要性
  • 现代数据工程的关键原则
  • Delta Lake如何为分析提供可靠的数据
  • 采用Delta Lake为数据湖供电的便利性
  • 如何将Delta Lake整合到您的数据基础设施中以实现数据科学

你需要:
注册社区版在这里并获得研讨会演示材料和样本笔记本。

高级:潜入三角洲湖

深入了解Delta Lake的内部结构,这是一种流行的开源技术,在您的数据湖之上支持ACID事务、时间旅bob下载地址行、模式强制等。

看现在