主页数据+ AI世界巡回赛2022 Logo
找到我的位置

2022年12月13日

目的地Lakehouse

美国东部时间上午09:00纽约市
纽约市中心万豪酒店
西街85号,奥尔巴尼街,
纽约,NY 10006

看点播

数据+ AI世界巡回赛纽约

Lakehouse正迅速成为数据架构的新标准,但每个地区都有自己独特的故事和挑战。

请与我们一起参加这次活动,我们的演讲者、客户和为您量身定制的内容。

我们的数据和人工智能专家、领导者和远见者阵容包括Databricks高管,以及来自Databricks的客户横跨美洲

演讲者

Arsalan Tavakoli的大头照

Arsalan Tavakoli

现场工程联合创始人兼高级副总裁

Shant Hovsepian的头像

一壶酒Hovsepian

首席软件工程师

Don Vu的头像

Vu不

CDO

美国西北相互

保罗·拉帕斯的大头照

Lappas保罗

产品经理

议程

8点我

8点我-早上9点
报名及早餐
看到细节

早上9点

主题
早上9点-上午10:45
主题演讲:发现湖屋
  • Lakehouse的案例,打破数据和治理竖井
  • 莱克豪斯案例,客户故事
  • Lakehouse的数据工程
  • Lakehouse上的数据仓库
  • 机器学习在湖屋
Arsalan Tavakoli的大头照
Arsalan Tavakoli
Don Vu的头像
Vu不
美国西北相互
保罗·拉帕斯的大头照
Lappas保罗
Shant Hovsepian的头像
一壶酒Hovsepian

11:15

突破会话
11:15-下午12点
目的地湖屋:一个平台上的所有数据,分析和人工智能bob体育客户端下载

数据湖屋是现代数据团队的未来,他们寻求通过数据架构进行创新,简化数据工作负载,简化协作,并保持灵活性和开放性,以保持公司规模的敏捷性。Databricks Lakehouse平台通过将bob体育客户端下载分析、数据工程、机器学习和跨云工作负载流统一在一个简单的开放数据平台上实现了这一想法。在本课程中,您将了解Databricks Lakehouse平台如何满足您对每个数据和分析工作负载的需求bob体育客户端下载,并通过实际客户应用程序、参考架构和演示来展示如何创建自己的现代数据解决方案。

Jai Behl的头像
洁Behl
突破会话
11:15-下午12点
Lakehouse上的ML:将数据和ML结合在一起加速AI用例

发现Databricks的最新创新,可以帮助您构建和运行下一代机器学习解决方案。本课程将深入研究Databricks机器学习,这是一个以数据为中心的AI平台,横跨整个机器学习生命周期——从数据摄取和模型训练到生产mlop。bob体育客户端下载您将了解可以在ML用例中利用的关键功能,并了解产品的实际情况。

Avinash Sooriyarachchi的头像
Avinash Sooriyarachchi
突破会话
11:15-下午12点
Lakehouse上的数据仓库

数据湖屋是下一个最好的数据仓库。在本课程中,学习Databricks SQL如何帮助您降低成本,并在几秒钟内通过即时,弹性SQL无服务器计算开始,以及如何使每个分析工程师和分析师使用他们最喜欢的BI和SQL工具(如Fivetran, dbt, Tableau或PowerBI)快速发现和分享新的见解。

香农·巴罗的大头照
香农巴罗
培训
11:15-下午两点
培训:Databricks Lakehouse概述

参加Databricks Lakehouse概述会议,了解Databricks Lakehouse平台如何帮助您在大数据和人工智能世界中竞争。bob体育客户端下载您将了解大数据的基本概念,解释构建数据团队时需要寻找的关键角色和能力,并熟悉完整数据环境的所有部分。我们还将回顾Databricks Lakehouse平台如何帮助您的组织简化工作流程,打破孤岛bob体育客户端下载,并最大限度地利用您的数据。

朱诺·李的大头照
朱诺李

下午12点

下午12点-下午一点
午餐

下午1:10

突破会话
下午1:10-55分下午
Delta活动表:ETL的现代软件工程和管理

数据工程师的艰巨任务是清理复杂多样的数据,并将其转化为可用的数据源,以推动数据分析、数据科学和机器学习。他们需要深入了解数据基础设施平台,用各种语言构建复杂的查询,并将它们组合在一起用于生bob体育客户端下载产。加入本次演讲,了解Delta Live Tables (DLT)如何简化数据转换和ETL的复杂性。DLT是第一个使用现代软件工程实践来交付任何规模的可靠和可信数据管道的ETL框架。了解分析师和数据工程师如何通过简单的管道开发和维护快速创新,如何通过自动化管理任务和获得管道操作的可视性来消除操作复杂性,内置质量控制和监控如何确保准确的BI、数据科学和ML,以及如何通过自我优化和自动扩展数据管道实现简化的批处理和流。

狄龙·博斯特威克的大头照
狄龙Bostwick
突破会话
下午1:10-55分下午
湖边小屋的激进速度:引擎盖下的光子

为了使湖屋成为现实,查询引擎需要同时支持结构化和非结构化数据,同时提供数据仓库的性能和数据湖的可伸缩性。在本课程中,了解Databricks的下一代向量化引擎Photon如何在SQL工作负载中优于现有的数据仓库,并在Apache Spark™API的支持下实现更通用的执行框架,以有效地处理数据。

菲利普·马赛的头像
菲利普·马赛
突破会话
下午1:10-55分下午
数据上的MLOps:在一个平台上统一DataOps、modelsop和DevOpsbob体育客户端下载

随着公司广泛推出ML,操作问题成为复杂性的主要来源。机器学习操作(MLOps)已经成为管理这种复杂性的实践。在Databricks,我们亲眼看到客户如何在各种各样的团队和业务中开发他们的MLOps方法。

在本次会议中,我们将分享Databricks如何通过Lakehouse在统一的平台上统一mlop的关键方面,即DataOps、ModelsOps和DevOps,从而实现更快、更可靠的生产ML,从而独特地解决这个问题。bob体育客户端下载我们将展示您的组织如何以增量方式构建健壮的MLOps实践。并揭示可以指导您组织的mlop决策的一般原则,展示我们在客户中观察到的最常见的目标架构。

Avinash Sooriyarachchi的头像
Avinash Sooriyarachchi

下午2点

突破会话
下午2点-下午两点
使用Databricks工作流轻松编制

编排和管理端到端生产管道一直是许多组织的瓶颈。数据团队花费太多时间拼接管道任务,手动管理和监控编排过程——严重依赖外部或特定于云的编排解决方案,所有这些都减慢了新数据的交付。在本次会议中,我们将向您介绍Databricks工作流:在Databricks Lakehouse平台中构建的所有数据、分析和人工智能的全面管理编排服务。bob体育客户端下载加入我们,深入了解新的工作流功能,并了解与底层平台的集成。bob体育客户端下载您将学习如何创建和运行可靠的生产工作流,集中管理和监控工作流,以及如何实现修复和运行等恢复操作,以及其他新功能。

迪伦·盖斯纳的头像
迪伦Gessner
突破会话
下午2点-下午两点
数据流在湖屋

流媒体是所有数据管道和应用程序的未来。它使企业能够更快地做出数据驱动的决策,更快地做出反应,开发以前认为不可能的数据驱动应用程序,并为客户提供新的和差异化的体验。然而,许多组织还没有实现流的全部潜力,因为它要求他们在新的、复杂的、专有的和脱节的技术堆栈上完全重新开发他们的数据管道和应用程序。

艾玛·斯坦的大头照
艾玛·斯坦
悉达多·阿加瓦尔的大头照
悉达多阿加瓦尔
突破会话
下午2点-下午两点
如何用语义层在Lakehouse上扩展商业智能

了解如何使用AtScale作为通用语义层在Databricks Lakehouse上扩展极快的商业智能(BI)。本课程将提供实用的建议,通过利用Databricks SQL和AtScale的通用语义层,在Databricks Lakehouse之上运行所有类型的大型BI工作负载。了解AtScale如何将查询下推到Databricks Lakehouse,而不需要从Databricks基础设施转移数据,同时以较低的成本交付闪电般的交互式查询。此外,您将看到如何使用通用语义层在任何BI/AI工具(如Power BI, Tableau, Excel, Looker, Jupyter notebook等)之间提供一致的指标,使用与Databricks Lakehouse的实时连接。

戴夫·马里亚尼的大头照
戴夫·马里安尼
AtScale

下午三点

突破会话
下午三点-下午3:45的时候
简化迁移到Lakehouse - Databricks方法

世界各地的客户正在经历从传统的本地Hadoop架构迁移到云中的现代Databricks Lakehouse的巨大成功。在Databricks,我们制定了一种迁移方法,帮助客户轻松地完成迁移过程。在这次演讲中,我们将接触到一些将风险最小化并简化迁移到Databricks过程的关键元素,并将介绍一些客户旅程和用例。

Swaroop Oggu的头像
Swaroop Oggu
突破会话
下午三点-下午3:45的时候
统一目录:Lakehouse上的数据和AI资产统一治理之旅

现代数据资产有多种形式:不仅仅是文件或表,还包括仪表板、ML模型以及视频和图像等非结构化数据,所有这些都不能由遗留数据治理解决方案进行治理和管理。参加本次会议,了解数据团队如何使用Unity Catalog以基于熟悉的ANSI SQL的公共治理模型集中管理所有数据和AI资产,确保更好的本机性能和安全性。内置的自动化数据沿袭提供了数据如何从源流向消费的端到端可见性,因此组织可以识别和诊断数据更改的影响。Unity Catalog提供了利用现有数据目录和解决方案的灵活性,并建立了一个面向未来的集中式治理,而无需昂贵的迁移成本。它还为数据合规性和安全性创建详细的审计报告,同时确保数据团队能够快速发现和引用BI、分析和ML工作负载的数据,加快实现价值的时间。

Tomasz Bacewicz的大头照
托马斯Bacewicz
突破会话
下午三点-下午3:45的时候
深潜:如何在数据库上构建现代数据栈来解决现代问题

每个人都想缩短将数据转化为可操作信息所需的时间。这通常涉及到将几个数据工具集成到所谓的现代数据堆栈(MDS)中。但是,通过将MDS扎根于数据仓库,大多数方法只关注了问题的一半。一个真正的MDS应该解决所有现代问题,这意味着除了报告和BI之外,还要解决AI和流媒体。在这个深入的演示会议中,我们将向您展示如何轻松地将Databricks Lakehouse平台集成到您的现代数据堆栈中,跨SQL, AI/ML和流连接您的所有数据工具,并发现新的方法来更快地解锁bob体育客户端下载见解。

普尔吉特·查达的头像
查达Pulkit

下午4点

下午4点-下午6点
网络信号

赞助单位: