Apache捻角羚

回到术语表

什么是阿帕奇库杜?

Apache Kudu是为Apache开发的免费、开bob下载地址源的柱状存储系统Hadoop它是一个用于结构化数据的引擎,支持对单个行的低延迟随机访问(毫秒级)以及出色的分析访问模式。它是一个大数据引擎,创建连接广泛传播的Hadoop分布式文件系统[HDFSHBase NoSQL数据库。 Apache Kudu标志

Apache Kudu的主要优势是支持Hadoop上的商业智能[BI]

Apache Kudu的主要优点

对快速数据进行实时分析

Apache Kudu融合了HBase和Parquet的优点。它在吸收数据方面和HBase一样快,在分析查询方面几乎和Parquet一样快。支持多种查询类型,支持如下操作:
  • 通过键查找某个值。
  • 查找已按键顺序排序的键范围。
  • 根据需要跨任意多个列执行任意查询

完全分布式和容错

Apache Kudu使用RAFT共识算法,因此,它可以根据需要横向扩展或缩小。此外,它还支持就地更新功能。

利用即将到来的新一代硬件

Apache Kudu针对SSD进行了优化,旨在利用下一代持久内存。它可以扩展到每台服务器10个内核,甚至可以利用SIMD操作进行数据并行计算。

提供大数据BI所需的可变性

它的特点是“缓慢变化的维度”,也被称为SCD。此功能允许用户跟踪维度引用数据中的更改。

Kudu支持SQL,如果与Spark或Impala一起使用。

您想通过SQL访问数据吗?然后,您会很高兴地听到Apache Kudu与Apache Impala以及Spark紧密集成。因此,您将能够使用这些工具通过使用其SQL语法从Kudu平板电脑插入、查询、更新和删除数据。此外,您可以使用JDBC或ODBC将现有或新的应用程序连接到您的Kudu数据,无论它们是用什么语言编写的、框架,甚至是商业智能工具,使用Impala作为工具来完成此工作。

额外的资源


回到术语表