Apache Kudu란무엇입니까?

Apache Kudu는ApacheHadoop용으로개발한무료,오픈소스컬럼기반스토리지시스템입니다。각각의행에낮은레이턴시(低延迟)랜덤액세스,밀리초급의액세스를지원하며우수한분석액세스패턴을제공하는구조적데이터용엔진이며,널리보급된Hadoop分布式文件系统(HDFS]및HBase NoSQL数据库를연결하기위해만든빅데이터엔진이기도합니다。Apache Kudu로고

하둡에서비즈니스텔리전스[BI]지원에Apache Kudu가가지는주된장점

Apache Kudu의주된장점

고속데이터에대한실시간분석지원

Apache Kudu는HBase와Parquet의장점을합쳐제공합니다。데이터수집은HBase만큼빠르고,분석쿼리에관해서는铺의속도에비견할만합니다。또한여러가지쿼리유형을지원하여다음과같은작업을수행할수있게해줍니다。

  • 특정키를이용해해당값을검색합니다。
  • 정렬되어있는키를이용해일정범위의키를조회합니다。
  • 필한만큼얼마든지많은수의열에걸쳐임의쿼리를수행합니다。

완전분산형,내결함성

Apache捻角羚는筏컨센서스알고리즘을사용하므로필요에따라수평적으로스케일업또는다운시킬수있습니다。또한update-in-place기능도지원합니다。

다음세대하드웨어의장점활용

Apache捻角羚SSD에는최적화되어있으며다음세대비휘발성메모리의장점을활용할수있도록고안하였습니다。서버당수십대의코어에맞춰확장할수있으며,데이터병렬식(方式来表述数据并行处理)연산에SIMD작업의장점도활용할수있습니다。

빅데이터에서bi에필한변경가능성제공

여기에는일명SCD라고하는'缓慢变化维度(느린차원변경)구조가있습니다。이기능을사용하면사용자가차원참조데이터내의변경사항을추적할수있습니다。

Kudu는Spark나Impala와함께사용하면SQL지원

Sql을통해데이터에액세스하고자합니까?Apache捻角羚는Apache黑斑羚는물론火花와도긴밀하게통합된다는반가운소식을알려드립니다。따라서이러한툴을사용하여捻角羚태블릿의데이터를SQL구문을사용해삽입,쿼리,업데이트하고삭제할수있습니다。뿐만아니라,JDBC나ODBC를사용해기존또는신규애플리케이션(작성언어,프레임워크불문)은물론비즈니스인텔리전스툴까지捻角羚데이터에연결할수있습니다。이경우黑斑羚를툴로활용하면됩니다。

额外的资源

回到术语表