主页数据+ AI世界巡回赛2022 Logo
找到我的位置

2022年12月13日

目的地Lakehouse

虚拟|太平洋标准时间上午8:00,美国东部标准时间上午11:00

看点播

Data + AI世界巡回赛美洲

Lakehouse正迅速成为数据架构的新标准,但每个地区都有自己独特的故事和挑战。

请加入我们虚拟事件演讲者、客户和为您设计的内容。

我们的数据和人工智能专家、领导者和远见者阵容包括Arsalan Tavakoli,以及Databricks的客户横跨美洲

演讲者

Arsalan Tavakoli的大头照

Arsalan Tavakoli

现场工程联合创始人兼高级副总裁

Shant Hovsepian的头像

一壶酒Hovsepian

首席软件工程师

比拉尔·阿斯拉姆的头像

Bilal Aslam

产品管理高级总监

帕特里克·温德尔的大头照

帕特里克·温德尔

副总裁、工程

议程

上午11

主题
上午11-12点45
主题演讲:发现湖屋

随着数据、分析和人工智能世界之间的联系越来越紧密,人们越来越需要一个平台来统一数据源、用例和工作负载。bob体育客户端下载数据湖屋消除了将业务分析师与数据科学家、结构化数据与实时流数据、商业智能与人工智能分开的障碍。本次开幕主题演讲探讨了lakehouse的简单、开放、多云方法如何简化数据管理、统一数据团队并实现更多计划。

使用演示驱动的方法,本次主题演讲将清楚地描述数据工程、数据仓库、数据科学和机器学习的主要数据工作负载是如何在Databricks Lakehouse平台的架构中编排的。bob体育客户端下载

  • Lakehouse的案例,打破数据和治理竖井
  • 莱克豪斯案例,客户故事
  • Lakehouse的数据工程
  • Lakehouse上的数据仓库
  • 机器学习在湖屋
Arsalan Tavakoli的大头照
Arsalan Tavakoli
Shant Hovsepian的头像
一壶酒Hovsepian
比拉尔·阿斯拉姆的头像
Bilal Aslam
克雷格·威利的头像
克雷格·威利
看到细节

下午一点十五分

突破会话
下午一点十五分-下午2点
目的地湖屋:一个平台上的所有数据,分析和人工智能bob体育客户端下载

数据湖屋是现代数据团队的未来,他们寻求通过数据架构进行创新,简化数据工作负载,简化协作,并保持灵活性和开放性,以保持公司规模的敏捷性。Databricks Lakehouse平台通过将bob体育客户端下载分析、数据工程、机器学习和跨云工作负载流统一在一个简单的开放数据平台上实现了这一想法。在本课程中,您将了解Databricks Lakehouse平台如何满足您对每个数据和分析工作负载的需求bob体育客户端下载,并通过实际客户应用程序、参考架构和演示来展示如何创建自己的现代数据解决方案。

Erika Ehrli的大头照
Erika Ehrli
突破会话
下午一点十五分-下午2点
Lakehouse上的数据仓库

数据湖屋是下一个最好的数据仓库。在本课程中,学习Databricks SQL如何帮助您降低成本,并在几秒钟内通过即时,弹性SQL无服务器计算开始,以及如何使每个分析工程师和分析师使用他们最喜欢的BI和SQL工具(如Fivetran, dbt, Tableau或PowerBI)快速发现和分享新的见解。

佛朗哥·帕塔诺的大头照
佛朗哥Patano
突破会话
下午一点十五分-下午2点
Lakehouse上的ML:将数据和ML结合在一起加速AI用例

发现Databricks的最新创新,可以帮助您构建和运行下一代机器学习解决方案。本课程将深入研究Databricks机器学习,这是一个以数据为中心的AI平台,横跨整个机器学习生命周期——从数据摄取和模型训练到生产mlop。bob体育客户端下载您将了解可以在ML用例中利用的关键功能,并了解产品的实际情况。

普雷姆普拉卡什的头像
但是过犹不及普拉卡什
尼古拉斯·佩莱斯的大头照
尼古拉斯Pelaez
培训
下午一点十五分-下午两点
培训:Databricks Lakehouse概述

参加Databricks Lakehouse概述会议,了解Databricks Lakehouse平台如何帮助您在大数据和人工智能世界中竞争。bob体育客户端下载您将了解大数据的基本概念,解释构建数据团队时需要寻找的关键角色和能力,并熟悉完整数据环境的所有部分。我们还将回顾Databricks Lakehouse平台如何帮助您的组织简化工作流程,打破孤岛bob体育客户端下载,并最大限度地利用您的数据。

下午3:10

突破会话
下午3:10-小时55分
Delta活动表:ETL的现代软件工程和管理

数据工程师的艰巨任务是清理复杂多样的数据,并将其转化为可用的数据源,以推动数据分析、数据科学和机器学习。他们需要深入了解数据基础设施平台,用各种语言构建复杂的查询,并将它们组合在一起用于生bob体育客户端下载产。加入本次演讲,了解Delta Live Tables (DLT)如何简化数据转换和ETL的复杂性。DLT是第一个使用现代软件工程实践来交付任何规模的可靠和可信数据管道的ETL框架。了解分析师和数据工程师如何通过简单的管道开发和维护快速创新,如何通过自动化管理任务和获得管道操作的可视性来消除操作复杂性,内置质量控制和监控如何确保准确的BI、数据科学和ML,以及如何通过自我优化和自动扩展数据管道实现简化的批处理和流。

保罗·拉帕斯的大头照
Lappas保罗
突破会话
下午3:10-小时55分
湖边小屋的激进速度:引擎盖下的光子

为了使湖屋成为现实,查询引擎需要同时支持结构化和非结构化数据,同时提供数据仓库的性能和数据湖的可伸缩性。在本课程中,了解Databricks的下一代向量化引擎Photon如何在SQL工作负载中优于现有的数据仓库,并在Apache Spark™API的支持下实现更通用的执行框架,以有效地处理数据。

贾斯汀·布里斯的大头照
贾斯汀Breese
突破会话
下午3:10-小时55分
数据上的MLOps:在一个平台上统一DataOps、modelsop和DevOpsbob体育客户端下载

随着公司广泛推出ML,操作问题成为复杂性的主要来源。机器学习操作(MLOps)已经成为管理这种复杂性的实践。在Databricks,我们亲眼看到客户如何在各种各样的团队和业务中开发他们的MLOps方法。

在本次会议中,我们将分享Databricks如何通过Lakehouse在统一的平台上统一mlop的关键方面,即DataOps、ModelsOps和DevOps,从而实现更快、更可靠的生产ML,从而独特地解决这个问题。bob体育客户端下载我们将展示您的组织如何以增量方式构建健壮的MLOps实践。并揭示可以指导您组织的mlop决策的一般原则,展示我们在客户中观察到的最常见的目标架构。

Rafi Kurlansik的头部特写
Rafi Kurlansik

下午4:05

突破会话
下午4:05-下午4:40
使用Databricks工作流轻松编制

编排和管理端到端生产管道一直是许多组织的瓶颈。数据团队花费太多时间拼接管道任务,手动管理和监控编排过程——严重依赖外部或特定于云的编排解决方案,所有这些都减慢了新数据的交付。在本次会议中,我们将向您介绍Databricks工作流:在Databricks Lakehouse平台中构建的所有数据、分析和人工智能的全面管理编排服务。bob体育客户端下载加入我们,深入了解新的工作流功能,并了解与底层平台的集成。bob体育客户端下载您将学习如何创建和运行可靠的生产工作流,集中管理和监控工作流,以及如何实现修复和运行等恢复操作,以及其他新功能。

罗兰的头像Fäustlin
罗兰Faustlin
突破会话
下午4:05-下午4:40
数据流在湖屋

流媒体是所有数据管道和应用程序的未来。它使企业能够更快地做出数据驱动的决策,更快地做出反应,开发以前认为不可能的数据驱动应用程序,并为客户提供新的和差异化的体验。然而,许多组织还没有实现流的全部潜力,因为它要求他们在新的、复杂的、专有的和脱节的技术堆栈上完全重新开发他们的数据管道和应用程序。

Steven Yu的大头照
史蒂文余
悉达多·阿加瓦尔的大头照
悉达多阿加瓦尔

下午5点

突破会话
下午5点-下午5:45
简化迁移到Lakehouse - Databricks方法

世界各地的客户正在经历从传统的本地Hadoop架构迁移到云中的现代Databricks Lakehouse的巨大成功。在Databricks,我们制定了一种迁移方法,帮助客户轻松地完成迁移过程。在这次演讲中,我们将接触到一些将风险最小化并简化迁移到Databricks过程的关键元素,并将介绍一些客户旅程和用例。

罗恩·格雷罗的头像
罗恩·格雷罗州
Ramachandran Venkat的大头照
拉马钱德兰引导
突破会话
下午5点-下午5:45
统一目录:Lakehouse上的数据和AI资产统一治理之旅

现代数据资产有多种形式:不仅仅是文件或表,还包括仪表板、ML模型以及视频和图像等非结构化数据,所有这些都不能由遗留数据治理解决方案进行治理和管理。参加本次会议,了解数据团队如何使用Unity Catalog以基于熟悉的ANSI SQL的公共治理模型集中管理所有数据和AI资产,确保更好的本机性能和安全性。内置的自动化数据沿袭提供了数据如何从源流向消费的端到端可见性,因此组织可以识别和诊断数据更改的影响。Unity Catalog提供了利用现有数据目录和解决方案的灵活性,并建立了一个面向未来的集中式治理,而无需昂贵的迁移成本。它还为数据合规性和安全性创建详细的审计报告,同时确保数据团队能够快速发现和引用BI、分析和ML工作负载的数据,加快实现价值的时间。

泽山爸爸的大头照
Zeashan颇为
突破会话
下午5点-下午5:45
深潜:如何在数据库上构建现代数据栈来解决现代问题

每个人都想缩短将数据转化为可操作信息所需的时间。这通常涉及到将几个数据工具集成到所谓的现代数据堆栈(MDS)中。但是,通过将MDS扎根于数据仓库,大多数方法只关注了问题的一半。一个真正的MDS应该解决所有现代问题,这意味着除了报告和BI之外,还要解决AI和流媒体。在这个深入的演示会议中,我们将向您展示如何轻松地将Databricks Lakehouse平台集成到您的现代数据堆栈中,跨SQL, AI/ML和流连接您的所有数据工具,并发现新的方法来更快地解锁bob体育客户端下载见解。

Tahir Fayyaz的头像
Tahir Fayyaz

赞助单位: