数据+ AI世界巡回赛纽约
Lakehouse正迅速成为数据架构的新标准,但每个地区都有自己独特的故事和挑战。
请与我们一起参加这次活动,我们的演讲者、客户和为您量身定制的内容。
我们的数据和人工智能专家、领导者和远见者阵容包括Databricks高管,以及来自Databricks的客户横跨美洲.
演讲者

Arsalan Tavakoli
现场工程联合创始人兼高级副总裁
砖

一壶酒Hovsepian
首席软件工程师
砖

Vu不
CDO
美国西北相互
议程
8点我
早上9点
- Lakehouse的案例,打破数据和治理竖井
- 莱克豪斯案例,客户故事
- Lakehouse的数据工程
- Lakehouse上的数据仓库
- 机器学习在湖屋




数据湖屋是现代数据团队的未来,他们寻求通过数据架构进行创新,简化数据工作负载,简化协作,并保持灵活性和开放性,以保持公司规模的敏捷性。Databricks Lakehouse平台通过将bob体育客户端下载分析、数据工程、机器学习和跨云工作负载流统一在一个简单的开放数据平台上实现了这一想法。在本课程中,您将了解Databricks Lakehouse平台如何满足您对每个数据和分析工作负载的需求bob体育客户端下载,并通过实际客户应用程序、参考架构和演示来展示如何创建自己的现代数据解决方案。

发现Databricks的最新创新,可以帮助您构建和运行下一代机器学习解决方案。本课程将深入研究Databricks机器学习,这是一个以数据为中心的AI平台,横跨整个机器学习生命周期——从数据摄取和模型训练到生产mlop。bob体育客户端下载您将了解可以在ML用例中利用的关键功能,并了解产品的实际情况。
数据湖屋是下一个最好的数据仓库。在本课程中,学习Databricks SQL如何帮助您降低成本,并在几秒钟内通过即时,弹性SQL无服务器计算开始,以及如何使每个分析工程师和分析师使用他们最喜欢的BI和SQL工具(如Fivetran, dbt, Tableau或PowerBI)快速发现和分享新的见解。

参加Databricks Lakehouse概述会议,了解Databricks Lakehouse平台如何帮助您在大数据和人工智能世界中竞争。bob体育客户端下载您将了解大数据的基本概念,解释构建数据团队时需要寻找的关键角色和能力,并熟悉完整数据环境的所有部分。我们还将回顾Databricks Lakehouse平台如何帮助您的组织简化工作流程,打破孤岛bob体育客户端下载,并最大限度地利用您的数据。

下午12点
下午1:10
数据工程师的艰巨任务是清理复杂多样的数据,并将其转化为可用的数据源,以推动数据分析、数据科学和机器学习。他们需要深入了解数据基础设施平台,用各种语言构建复杂的查询,并将它们组合在一起用于生bob体育客户端下载产。加入本次演讲,了解Delta Live Tables (DLT)如何简化数据转换和ETL的复杂性。DLT是第一个使用现代软件工程实践来交付任何规模的可靠和可信数据管道的ETL框架。了解分析师和数据工程师如何通过简单的管道开发和维护快速创新,如何通过自动化管理任务和获得管道操作的可视性来消除操作复杂性,内置质量控制和监控如何确保准确的BI、数据科学和ML,以及如何通过自我优化和自动扩展数据管道实现简化的批处理和流。

为了使湖屋成为现实,查询引擎需要同时支持结构化和非结构化数据,同时提供数据仓库的性能和数据湖的可伸缩性。在本课程中,了解Databricks的下一代向量化引擎Photon如何在SQL工作负载中优于现有的数据仓库,并在Apache Spark™API的支持下实现更通用的执行框架,以有效地处理数据。

随着公司广泛推出ML,操作问题成为复杂性的主要来源。机器学习操作(MLOps)已经成为管理这种复杂性的实践。在Databricks,我们亲眼看到客户如何在各种各样的团队和业务中开发他们的MLOps方法。
在本次会议中,我们将分享Databricks如何通过Lakehouse在统一的平台上统一mlop的关键方面,即DataOps、ModelsOps和DevOps,从而实现更快、更可靠的生产ML,从而独特地解决这个问题。bob体育客户端下载我们将展示您的组织如何以增量方式构建健壮的MLOps实践。并揭示可以指导您组织的mlop决策的一般原则,展示我们在客户中观察到的最常见的目标架构。
下午2点
编排和管理端到端生产管道一直是许多组织的瓶颈。数据团队花费太多时间拼接管道任务,手动管理和监控编排过程——严重依赖外部或特定于云的编排解决方案,所有这些都减慢了新数据的交付。在本次会议中,我们将向您介绍Databricks工作流:在Databricks Lakehouse平台中构建的所有数据、分析和人工智能的全面管理编排服务。bob体育客户端下载加入我们,深入了解新的工作流功能,并了解与底层平台的集成。bob体育客户端下载您将学习如何创建和运行可靠的生产工作流,集中管理和监控工作流,以及如何实现修复和运行等恢复操作,以及其他新功能。

流媒体是所有数据管道和应用程序的未来。它使企业能够更快地做出数据驱动的决策,更快地做出反应,开发以前认为不可能的数据驱动应用程序,并为客户提供新的和差异化的体验。然而,许多组织还没有实现流的全部潜力,因为它要求他们在新的、复杂的、专有的和脱节的技术堆栈上完全重新开发他们的数据管道和应用程序。


了解如何使用AtScale作为通用语义层在Databricks Lakehouse上扩展极快的商业智能(BI)。本课程将提供实用的建议,通过利用Databricks SQL和AtScale的通用语义层,在Databricks Lakehouse之上运行所有类型的大型BI工作负载。了解AtScale如何将查询下推到Databricks Lakehouse,而不需要从Databricks基础设施转移数据,同时以较低的成本交付闪电般的交互式查询。此外,您将看到如何使用通用语义层在任何BI/AI工具(如Power BI, Tableau, Excel, Looker, Jupyter notebook等)之间提供一致的指标,使用与Databricks Lakehouse的实时连接。

下午三点
世界各地的客户正在经历从传统的本地Hadoop架构迁移到云中的现代Databricks Lakehouse的巨大成功。在Databricks,我们制定了一种迁移方法,帮助客户轻松地完成迁移过程。在这次演讲中,我们将接触到一些将风险最小化并简化迁移到Databricks过程的关键元素,并将介绍一些客户旅程和用例。

现代数据资产有多种形式:不仅仅是文件或表,还包括仪表板、ML模型以及视频和图像等非结构化数据,所有这些都不能由遗留数据治理解决方案进行治理和管理。参加本次会议,了解数据团队如何使用Unity Catalog以基于熟悉的ANSI SQL的公共治理模型集中管理所有数据和AI资产,确保更好的本机性能和安全性。内置的自动化数据沿袭提供了数据如何从源流向消费的端到端可见性,因此组织可以识别和诊断数据更改的影响。Unity Catalog提供了利用现有数据目录和解决方案的灵活性,并建立了一个面向未来的集中式治理,而无需昂贵的迁移成本。它还为数据合规性和安全性创建详细的审计报告,同时确保数据团队能够快速发现和引用BI、分析和ML工作负载的数据,加快实现价值的时间。

每个人都想缩短将数据转化为可操作信息所需的时间。这通常涉及到将几个数据工具集成到所谓的现代数据堆栈(MDS)中。但是,通过将MDS扎根于数据仓库,大多数方法只关注了问题的一半。一个真正的MDS应该解决所有现代问题,这意味着除了报告和BI之外,还要解决AI和流媒体。在这个深入的演示会议中,我们将向您展示如何轻松地将Databricks Lakehouse平台集成到您的现代数据堆栈中,跨SQL, AI/ML和流连接您的所有数据工具,并发现新的方法来更快地解锁bob体育客户端下载见解。

下午4点