创建或修改一个表使用文件上传

创建或修改一个表使用文件上传页面允许您上传CSV、TSV或JSON文件来创建或覆盖一个三角洲湖管理表。

您可以创建管理三角洲表统一目录或蜂巢metastore。

重要的

您可以使用UI创建一个增量表通过导入小CSV, TSV或JSON文件从您的本地机器上。

  • 创建或修改一个表使用文件上传页面支持同时上传10个文件。

  • 上传文件的总大小必须在100字节。

  • 文件必须是一个CSV、TSV或JSON和扩展”。csv”、“。tsv”或“. json。

  • 压缩文件等邮政编码焦油不支持文件。

上传的文件

  1. 点击新图标New >添加数据

  2. 点击创建或修改一个表

  3. 单击文件浏览器按钮或直接拖放文件在降级区。

请注意

进口文件上传到一个安全的内部位置您的帐户每日垃圾收集。

预览、配置和创建一个表

你可以上传数据到暂存区域没有连接到计算资源,但你必须选择一个活跃的计算资源预览和配置表。

你可以预览你的50行数据上传表的配置选项。点击网格或开关按钮下的文件名列表数据的表示。

砖存储数据文件管理表中包含的位置配置模式。你需要适当的权限来创建一个表在一个模式。

选择所需的模式中创建一个表,执行以下操作:

  1. 选择一个模式。

  2. (可选)编辑表名。

请注意

你可以使用下拉选择覆盖现有表创建新表。操作试图创建新表的名称冲突显示一条错误消息。

您可以配置选项在你创建的表。

要创建表,单击创建在页面的底部。

格式选项

格式选项取决于您上传的文件格式。通用格式选项出现在标题栏,更少的常用的选项是可用的先进的属性对话框。

  • CSV,可用以下选项:

    • 第一行包含了标题(默认启用):这个选项指定CSV / TSV文件是否包含一个头。

    • 列分隔符:列之间的分隔符。只允许一个字符,不支持反斜杠。这为CSV文件默认为逗号。

    • 自动检测列类型(默认启用):从文件内容自动检测列类型。您可以编辑预览表类型。如果这是设置为false,所有列类型推断字符串

    • 行跨多个线(默认情况下禁用):一个列的值是否能跨越多个文件中。

    • 合并多个文件的模式:是否推断模式跨多个文件和每个文件的合并模式。如果禁用,使用模式从一个文件。

  • 为JSON,下列选项可用:

    • 自动检测列类型(默认启用):从文件内容自动检测列类型。您可以编辑预览表类型。如果这是设置为false,所有列类型推断字符串

    • 行跨多个线(默认启用):一个列的值是否能跨越多个文件中。

    • 允许评论(默认启用):是否允许文件中的注释。

    • 允许单引号(默认启用):单引号是否允许在文件中。

    • 推断时间戳(默认启用):是否试图推断时间戳字符串作为TimestampType

数据更新时自动预览编辑格式选项。

请注意

当你上传多个文件,以下规则适用:

  • 标题设置适用于所有文件。确保头一直缺失或出现在所有上传的文件,以避免数据丢失。

  • 上传的文件将通过添加所有目标表中的数据行。加入或合并记录期间不支持文件上传。

列名称和类型

您可以编辑列名称和类型。

  • 编辑类型,单击图标类型。

  • 编辑列名称,点击输入框顶部的列。

    列名不支持逗号,反斜杠或者unicode字符(如emojis)。

列数据类型的默认为CSV和JSON文件。你可以解释所有列字符串类型通过禁用先进的属性>自动检测列类型

请注意

  • 模式推理做了最大的努力发现列类型。列类型的变更会导致一些值,如果该值不能正确地目标数据类型。铸造长整型数字日期时间戳不支持列。砖建议您首先创建一个表,然后将这些列使用SQL函数。

  • 支持特殊字符表列名,创建或修改一个表使用文件上传页面利用列映射

  • 将评论添加到列,并导航到创建的表数据浏览在那里你可以添加评论。

支持的数据类型

创建或修改一个表使用文件上传页面支持以下数据类型。关于个人数据类型的更多信息SQL数据类型

数据类型

描述

长整型数字

8字节整数数字签名。

布尔

布尔(真正的,)的值。

日期

字段的值组成的值年、月和天,没有一个时区。

8字节双精度浮点数。

字符串

字符串值。

时间戳

字段的值组成的值年,月,日,小时,分钟,第二,当地时区与会话。

已知的问题

铸造长整型数字non-castable类型等日期,如日期格式的“yyyy”,可能会引发错误。