在DBFS探索和创建表

重要的

这个文档已经退休了,可能不会被更新。产品、服务或技术中提到的这些内容不再支持。看到加载数据使用UI添加数据,创建或修改一个表使用文件上传,发现使用数据浏览和管理数据

访问遗留DBFS文件上传和表创建UI添加数据界面。点击新图标New > > DBFS数据

你也可以从笔记本通过点击访问UI文件>添加数据

砖推荐使用数据浏览对一种改进的经验和管理acl和查看数据对象创建或修改表从文件上传页面很容易摄取小文件到三角洲湖。

请注意

本文中描述的一些元素变化基于工作空间配置。联系您的工作区管理员或砖的代表。

导入数据

如果你有小数据文件在您的本地机器,你想分析砖,可以导入DBFS使用UI。

请注意

工作空间管理员可以禁用这个特性。有关更多信息,请参见管理数据上传

文件导入到DBFS存储在使用这些方法FileStore

创建一个表

您可以启动DBFS创建表界面通过点击新图标在侧边栏或DBFS按钮添加数据界面。你可以从文件填充表DBFS或上传文件。

与UI,你只能创造外部表

  1. 选择一个数据源,并遵循相应的小节中的步骤来配置表。

    如果一个砖工作区管理员上传文件选项禁用,你没有选择上传文件;你可以使用另一个数据源创建表。

    上传文件的说明

    1. 将文件拖动到文件dropzone或单击dropzone浏览并选择文件。上传后,显示为每个文件的路径。将类似的道路/ FileStore /表/ <文件名> - <整数>。<文件类型>。您可以使用这条道路在笔记本电脑读取数据。

    2. 点击用UI创建表

    3. 集群中的下拉,选择一个集群。

    说明DBFS

    1. 选择一个文件。

    2. 点击用UI创建表

    3. 集群中的下拉,选择一个集群。

  2. 点击预览表查看表。

  3. 表名字段中,选择覆盖默认的表名。表名只能包含小写字母数字字符和下划线,必须以小写字母或下划线。

  4. 创建的数据库字段中,选择覆盖选中默认的数据库。

  5. 文件类型字段中,选择覆盖的文件类型。

  6. 如果CSV文件类型:

    1. 列分隔符字段中,选择是否覆盖推断分隔符。

    2. 指示是否要使用第一行作为列标题。

    3. 指示是否推断模式。

  7. 如果文件类型是JSON,表明是否文件是多行。

  8. 点击创建表

查看数据库和表

请注意

工作区与数据浏览使没有访问遗留下面描述的行为。

点击数据图标数据在侧边栏。砖选择一个运行集群您具有访问权限的。数据库文件夹显示的数据库列表默认的选择数据库。表文件夹显示表的列表默认的数据库。

创建表列表

你可以改变集群从数据库菜单,创建表界面,或查看表界面。例如,从数据库菜单:

  1. 单击下脱字符号向下箭头上方的数据库文件夹。

  2. 选择一个集群。

    选择集群

查看表详细信息

表的细节视图显示表模式和示例数据。

  1. 点击数据图标数据在侧边栏。

  2. 在数据库文件夹,单击一个数据库。

  3. 在表文件夹,单击表名。

  4. 集群中的下拉,选择选择另一个集群渲染预览表。

    表的细节

    请注意

    预览显示表,火花SQL查询运行在集群中选择集群下拉。如果集群已经有一个工作负载运行,可能需要更长的时间来加载预览。

删除一个表使用UI

  1. 点击数据图标数据在侧边栏。

  2. 单击菜单下拉旁边的表名和选择删除