公司博客上

数据湖的分析与Tableau和湖屋建筑

分享这篇文章

在过去的两年里,我们已经看到许多组织将他们的数据工作转移到云端。它简化了访问和规模,以处理最大的容量。在Tableau,我们关注的是客户的选择和灵活性,我们使客户能够比以往任何时候都更快地迁移到云。

分析和数据科学/机器学习的努力开始融合,我们看到人们对直接连接数据湖进行分析的兴趣越来越大。大量数据从网络日志和物联网传感器快速进入云数据湖,它往往是混乱的。我们需要一种方法来理解数据,并以可靠和高效的方式交付数据。

为了实现这一点,我们看到越来越多的客户采用Lakehouse架构。这种新的体系结构将数据湖(低成本、灵活的内容结构)和数据仓库(高性能、数据可靠性)的优点集中到一个地方来存储数据。通过我们的合作伙伴Databricks,我们已经看到许多联合客户采用湖屋架构来支持他们的Tableau部署。Databricks通过提高数据湖的性能和可靠性来实现湖屋架构,因此Tableau用户可以直接查询数据湖。

本周Databricks宣布了一项新的SQL分析服务,它将为Tableau客户提供一种全新的分析数据湖的体验。他们所能达到的性能和规模是我们以前从未见过的。

Tableau用户将对新的SQL分析端点感到最兴奋,它可以立即与我们现有的Databricks连接器一起使用,无需更新。这将从两个方面改善对数据湖的访问,以进行分析:

  • 简单的设置。SQL Analytics端点简化了Tableau用于查询数据湖的Databricks集群的配置,不需要为Tableau用户处理集群管理,只需连接到Databricks SQL Analytics端点就可以了!
  • 性能改进。SQL Analytics使用Databricks Delta Engine,这是一个向量化查询引擎,具有改进的查询优化器和缓存功能,可实现真正快速的查询性能。

Delta Engine架构与Databricks为Tableau提供的新SQL Analytics服务一起使用。

客户的例子

下面是一些使用Databricks和Tableau的Lakehouse架构的客户示例。

  • Wehkamp使用Databricks和Delta Lake作为数据湖,使用Tableau为整个组织提供报告和临时分析,并使用Databricks进行数据科学。你可以阅读Wehkamp的实现在这个案例研究中
  • 零售服务提供商Flipp使用Databricks和Delta Lake创建了一个湖屋,他们的数据科学团队用于机器学习,工程团队用于产品特性分析,销售团队使用Tableau为客户提供分析。你可以在Tableau会议上观看他们的会议。
  • 美国空军使用Databricks和Delta Lake来管理他们所有的现金流分析,然后在Tableau中提供结果,以分析每个季度超过6500万条记录。你可以观看美国空军在数据+人工智能行业领导论坛上介绍他们的实施情况
在Tableau中的BI可视化示例演示了Databricks开创的Lakehouse架构所实现的强大分析功能。
图2。一个Flipp可视化示例

BOB低频彩了解更多关于Databricks和Tableau在这里

免费试用Databricks
看到所有公司博客上的帖子