布隆过滤器创建索引

适用于:检查标记是的砖的SQL检查标记是的砖运行时

创建一个新的布隆过滤器指数或重写数据;它为现有数据创建布鲁姆过滤器。命令失败如果表名或一列不存在。如果启用了布鲁姆过滤列,现有的布隆过滤器选项替换为新选项。

语法

创建BLOOMFILTER指数(]table_name({columnName1(选项]}(,])(选项]选项选项({key1(=]val1}(,])

参数

虽然是不可能建立一个布隆过滤器指数数据,已经写好,优化命令更新布鲁姆过滤器进行数据重组。因此,您可以回填布隆过滤器的运行优化表:

  • 如果你没有以前优化表。

  • 用不同的文件大小,要求数据文件被重写。

  • 与一个ZORDER(或一个不同的ZORDER,如果一个已经存在),要求数据文件被重写。

您可以调整布鲁姆过滤器通过定义选项列级别或在表级别:

  • fpp:假阳性的概率。每写布隆过滤器所需的假阳性率。这影响所需的比特数把单个项目在布隆过滤器和布隆过滤器的大小的影响。该值必须大于0小于或等于1。默认值是0.1需要5位/项。

  • numItems:文件可以包含许多不同的项目。这个设置对过滤的质量很重要,因为它影响的比特总数中使用布隆过滤器(条目的数量——每项的比特数)。如果这个设置是不正确的,布隆过滤器是非常稀少,浪费磁盘空间和放缓的查询必须下载这个文件,或者太完整和不准确(FPP)。该值必须大于0。缺省值是100万件。

  • maxExpectedFpp:最大期望假阳性概率布隆过滤器是写入磁盘。如果预期的FPP大于这个阈值,布隆过滤器的选择性太低;所花费的时间和资源使用布隆过滤器超过它的实用性。必须在0和1之间的值。默认是1.0(禁用)。

这些选项只有在写作中发挥作用的数据。您可以配置这些属性在不同层级:写操作,表级别,列的水平。列级别优先于表和操作水平,和表级优先于操作水平。

看到布隆过滤器的索引