三角洲表属性引用
湖储备δ表属性入手三角洲。
。这些属性可能有特定的含义,并影响行为时,这些属性集。
默认表属性
三角洲湖配置设置SparkSession覆盖默认表中属性为新三角洲湖表中创建会话。中使用的前缀SparkSession不同于表中使用的配置属性。
三角洲湖相依 |
SparkSession相依 |
---|---|
|
|
例如,设置delta.appendOnly=真正的
财产所有新三角洲湖表中创建一个会话,设置如下:
集火花。砖。δ。属性。违约。appendOnly=真正的
修改现有表的表属性,使用设置TBLPROPERTIES。
三角洲表属性
可用三角洲表属性包括以下:
财产 |
---|
看到三角洲表属性引用。 数据类型: 默认值: |
看到启用自动优化。 数据类型: 默认值:(一) |
看到启用自动优化。 数据类型: 默认值:(一) |
看到在检查站管理列级统计。 数据类型: 默认值: |
看到在检查站管理列级统计。 数据类型: 默认值:(一) |
是否支持增量表列和列映射相应的拼花列使用不同的名称。 数据类型: 默认值: |
数据类型: 默认值: |
列数为三角洲湖为跳过数据收集统计信息。的值 数据类型: 默认值: |
最短的时间前三角洲湖保持逻辑删除数据文件删除。这是为了防止失败后在陈旧的读者紧凑排列或分区覆盖。 这个值应该足够大,以确保:
看到配置数据保留时间旅行。 数据类型: 默认值: |
看到使改变数据提要。 数据类型: 默认值: |
一个事务的程度必须隔绝的修改由并发事务。 有效的值 看到隔离级别和写冲突砖。 数据类型: 默认值: |
三角洲的历史表保存多长时间。 每次写的一个检查站,三角洲湖自动清理日志条目超过保留时间间隔。如果将此属性设置为一个足够大的价值,许多日志条目被保留。这应该不会影响性能,操作日志是常数时间。历史上的操作是平行但日志大小增加将变得更加昂贵。 看到配置数据保留时间旅行。 数据类型: 默认值: |
最低要求协议版本为读者,让读者阅读从δ表。 看到表协议版本。 数据类型: 默认值: |
作家的最低要求协议版本为一个作家可以写这个δ表。 看到表协议版本。 数据类型: 默认值: |
例如,这可能提高Amazon S3性能当三角洲湖需要发送大量的Amazon S3呼吁更好的跨S3服务器分区。 看到三角洲表属性引用。 数据类型: 默认值: |
当 看到三角洲表属性引用。 数据类型: 默认值: |
最短的时间内新快照将保留事务标识符(例如, 数据类型: 默认值:(一) |
目标文件大小的字节或更高的单位文件调优。例如, 数据类型: 默认值:(一) |
数据类型: 默认值:(一) |