Apache捻角羚

回到术语表

什么是阿帕奇库杜?

Apache Kudu是为Apache开发的免费、开bob下载地址源的柱状存储系统Hadoop．它是一个用于结构化数据的引擎，支持对单个行的低延迟随机访问(毫秒级)以及出色的分析访问模式。它是一个大数据引擎，创建连接广泛传播的Hadoop分布式文件系统[HDFSHBase NoSQL数据库。 Apache Kudu标志

Apache Kudu的主要优势是支持Hadoop上的商业智能[BI]

对快速数据进行实时分析

Apache Kudu融合了HBase和Parquet的优点。它在吸收数据方面和HBase一样快，在分析查询方面几乎和Parquet一样快。支持多种查询类型，支持如下操作:

通过键查找某个值。
查找已按键顺序排序的键范围。
根据需要跨任意多个列执行任意查询

完全分布式和容错

Apache Kudu使用RAFT共识算法，因此，它可以根据需要横向扩展或缩小。此外，它还支持就地更新功能。

利用即将到来的新一代硬件

Apache Kudu针对SSD进行了优化，旨在利用下一代持久内存。它可以扩展到每台服务器10个内核，甚至可以利用SIMD操作进行数据并行计算。

提供大数据BI所需的可变性

它的特点是“缓慢变化的维度”，也被称为SCD。此功能允许用户跟踪维度引用数据中的更改。

Kudu支持SQL，如果与Spark或Impala一起使用。

您想通过SQL访问数据吗?然后，您会很高兴地听到Apache Kudu与Apache Impala以及Spark紧密集成。因此，您将能够使用这些工具通过使用其SQL语法从Kudu平板电脑插入、查询、更新和删除数据。此外，您可以使用JDBC或ODBC将现有或新的应用程序连接到您的Kudu数据，无论它们是用什么语言编写的、框架，甚至是商业智能工具，使用Impala作为工具来完成此工作。

额外的资源

回到术语表