在Databricks SQL、PowerBI和Tableau中运行并可视化查询

本快速入门教程向您展示如何查询人员表以查找已命名的女性的数量玛丽按出生年份分组,并可视化结果。

该表的列为idfirstNamemiddleName性别生日ssn,工资

本文展示了如何使用Databricks SQL UI和BI工具权力BI而且表在线执行相同的查询。

在开始之前

您的Databricks SQL管理员必须完成Databricks SQL设置查询表的用户在完成以下部分中的步骤之前。

切换到不同的工作空间

如果在同一个帐户中可以访问多个工作区,则可以在它们之间快速切换。

  1. 单击Databricks工作区顶部栏中的工作区名称。

  2. 从下拉菜单中选择一个工作空间以切换到该工作空间。

登录“Databricks SQL”

您可以使用侧边栏访问所有Databricks资产。侧边栏的内容取决于所选择的角色:数据科学与工程机器学习,或SQL

  • 默认情况下,侧边栏以折叠状态显示,只有图标可见。将光标移到侧栏上以展开到完整视图。

  • 要更改角色,请单击Databricks徽标下面的图标砖的标志,并选择一个角色。

    改变形象
  • 要固定角色,以便下次登录时出现,请单击销的角色在人物角色旁边。再次单击以移除引脚。

  • 使用菜单选项在侧边栏底部,将侧边栏模式设置为汽车(默认行为),扩大,或崩溃

如果显示Databricks数据科学与工程或Databricks机器学习环境,请使用边栏切换到Databricks SQL。如果您没有Databricks SQL的访问权限,请向管理员请求访问权限。

当你登录到Databricks SQL时,你的登录页面是这样的:

用户登录页面

查询Databricks SQL中的people表

设置查询表的用户,管理员创建了一个名为people10.在本节中,您将在该表上运行一个查询,查询每个出生年份中名为Mary的人数。

  1. 点击新图标在侧栏中选择查询

    SQL编辑器将显示。

  2. 选择起动器仓库(或你选择的仓库)。

    第一次创建查询时,可用SQL仓库的列表将按字母顺序显示。下次创建查询时,将选择最后使用的仓库。

  3. 粘贴进去选择查询指定的女性数量的语句玛丽每年出生的孩子:

    选择一年生日作为birthYear作为总计默认的people10m在哪里firstName“玛丽”性别“F”集团通过birthYear订单通过birthYear
  4. 新闻Ctrl/Cmd + Enter或者点击运行(1000)

    限制1000默认情况下为所有查询选择,以确保查询最多返回1000行。如果希望返回此查询的所有行,可以取消选择限制1000请按运行(1000)下拉。如果要指定不同的行数限制,可以添加限制子句中使用您选择的值。

    查询结果显示在“表格”页签中。

    查询结果
  5. 点击保存保存此查询。

  6. 保存查询文本框,输入玛丽并点击保存

在Databricks SQL中创建一个可视化

  1. 在结果表中,单击+然后点击可视化

    可视化编辑器将显示。

    可视化编辑器
  2. 将可视化名称更改为散点1玛丽通过出生一年

  3. 可视化类型下拉,选择酒吧

  4. X列下拉,验证birthYear被选中。

  5. Y列下拉,验证总计被选中。

  6. 单击X轴选项卡。

  7. 在Name字段中输入出生一年

  8. 单击Y轴选项卡。

  9. 在Name字段中输入数量玛丽通过出生一年

  10. 点击保存

    保存的图表显示在SQL编辑器中。

    玛丽的SQLA图表

在Databricks SQL中创建一个仪表板

  1. 点击新图标在侧栏中选择指示板

  2. 输入作为仪表板名称。

  3. 点击保存

  4. 添加下拉列表,单击可视化

  5. 在查询列表中,选择玛丽

  6. 选择现有的可视化列表中,选择玛丽通过出生一年

  7. 标题文本框,输入玛丽通过出生一年

    添加可视化小部件
  8. 点击添加到仪表板

  9. 点击做编辑

    完整的仪表板

获取SQL仓库连接详细信息

  1. 点击端点图标SQL仓库在侧栏中。

  2. 在仓库列表中,键入起动器在过滤器盒(或你选择的其他过滤器)。

  3. 单击起动器仓库链接(或您选择的仓库)。

  4. 单击连接细节选项卡。

    连接细节
  5. 点击复制图标复制“服务器主机名”和“HTTP路径”。

获取一个个人访问令牌

个人访问令牌对Databricks SQL进行身份验证。

  1. 单击工作区右上角菜单栏上的用户名,然后选择用户设置从下拉列表。

  2. 单击个人访问令牌选项卡。

  3. 点击+生成新令牌

  4. 可选地输入注释并修改令牌生存期。

  5. 点击生成

  6. 点击复制图标复制令牌,单击好吧

使用Power BI查询Databricks SQL

配置Power BI到Databricks SQL的连接

  1. 选择获取数据>更多…> Azure并选择Azure砖连接器。

    在获取数据列表中的Databricks连接器

    请注意

    尽管标签上写着Azure砖,该连接器还可以与AWS上的Databricks一起使用。

  2. 点击连接

  3. 输入您复制的服务器主机名和HTTP路径获取SQL仓库连接详细信息

    电源BI数据源
  4. 点击好吧

  5. 在身份验证提示符下,选择个人访问令牌选项卡。输入您复制的个人访问令牌获取一个个人访问令牌

  6. 点击连接

    如果SQL仓库没有运行,它将启动,但可能需要几分钟才能变得可用。

  7. 在“电源BI导航器”中,选择default.people10m表格

  8. 点击负载

塑造数据

返回名字为玛丽的女性的记录,并计算每年玛丽的数量。

  1. 删除所有列,除了firstName性别,生日

  2. 使用firstName玛丽而且性别F

  3. 更改类型生日日期并删除除年份以外的所有日期组件。

  4. 按年份分组,计算每年圣母玛利亚的数量。

mary Power BI表

可视化数据

Marys Power BI图表

使用Tableau在线查询Databricks SQL

配置从Tableau Online到Databricks SQL的连接

  1. 在Tableau Online中,打开工作簿或创建一个新的工作簿。

  2. 选择数据>新数据源

    Tableau在线数据源
  3. 在“连接到数据”对话框中,选择连接器>数据

    Tableau在线数据
  4. 在Databricks连接对话框中,输入服务器主机名而且HTTP路径你复制进去了获取SQL仓库连接详细信息

    Tableau数据源
  5. 验证使用令牌的用户名和令牌获取一个个人访问令牌作为密码。

  6. 点击登录

    如果SQL仓库没有运行,它将启动,但可能需要几分钟才能变得可用。

  7. 在Schema字段中输入默认的.新闻输入

  8. 选择模式下拉,选择默认的

  9. 在Table字段中输入people10m.新闻输入

  10. 拖动people10表到画布。

塑造数据

返回名字为玛丽的女性的记录,并计算每年玛丽的数量。

  1. 删除所有列,除了firstName性别,生日

  2. 使用firstName玛丽而且性别F

  3. 更改类型生日日期并删除除年份以外的所有日期组件。

  4. 按年份分组,计算每年圣母玛利亚的数量。

玛丽的Tableau桌子

可视化数据

形象化的柱状图:

Marys Tableau图表