데이터웨어하우스는
현재는적합하지않습니다
CD,일회용카메라,플로피디스크등지난40년간등장한대부분의혁신제품처럼데이터웨어하우스역시전성기를누렸습니다。하지만새로운사용사례가나타나면서새로운기술이탄생했습니다。Cd는음악을스트리밍할수없습니다。필름카메라는사진을공유하지못합니다。플로피디스크는무한한클라우드스토리지에비교가됩니다。그리고데이터웨어하우스는ai를수행할수없습니다。
이제는더단순한
접근방식이필한때
Ai는모든기업의우선순위입니다。하지만오늘날복잡한구식레거시프라는ai가지닌가능성을활용하지못합니다。오늘날요구사항을충족하고미래의어떤환경에도대비할수있도록구축된새로운데이터아키텍처가필요한때입니다。
새로운데이터및
Ai시대의시작
데이터레이크하우스는데이터웨어하우스와데이터레이크를단일플랫폼에최적화하여조합한오픈데이터아키텍처입니다。
이제는구조적,반구조적,비구조적등모든유형의데이터를오픈데이터레이크에저장하고,데이터웨어하우스급데이터품질과성능,보안,거버넌스를확보할수있습니다。이로써레이크하우스는비즈니스인텔리전스,SQL,분석,실시간데이터애플리케이션,데이터사이언스,머신러닝을단일플랫폼에서지원하는유일한데이터아키텍처가됩니다。
모든사용사례를지원하는단일플랫폼
웨어하우스가하지못하는기능을
수행하는레이크하우스
레이크하우스는데이터웨어하우스의한계를뛰어넘습니다。기본적으로기존의데이터웨어하우스와머신러닝을모두지원하는동시에모든유형의데이터를관리할수있도록설계되었습니다。기존의데이터레이크에이러한기능을추가하여모든데이터를관리하고모든사용사례를지원하는단일오픈시스템을창출합니다。
데이터웨어하우스 | ||
---|---|---|
폐쇄형 | 오픈 | |
구조* | 모든데이터유형 | |
제한적** | 뛰어난확장성 | |
$ $ $ | $ | |
BI、SQL | Bi, sql, ml,실시간앱 | |
SQL | SQL, R, Python등의언어로된파일에직접액세스하기위한개방형API | |
酸트랜잭션을통한정적고품질데이터 | 酸트랜잭션을통한정적고품질데이터 | |
테이블의행/열단위까지세분화된보및거버넌스 | 테이블의행/열단위까지세분화된보및거버넌스 | |
높음 | 높음 |
*반구조적데이터는한정적으로지원
**막대한확장비용
레이크하우스는데이터레이크를전환합니다
레이크하우스는데이터레이크가데이터늪이되게했던근본적문제를극복합니다。레이크하우스는트랜잭션,스키마,거버넌스와같은핵심적인데이터웨어하우징기능을추가하여데이터레이크의품질을향상합니다。또한다양한성능최적화기술로분석을빠르게수행하도록합니다。레이크하우스는오픈데이터레이크에이러한데이터관리및성능최적화기능을제공하여기본적으로BI및毫升애플리케이션을지원합니다。
데이터레이크 | ||
---|---|---|
오픈 | 오픈 | |
모든데이터유형 | 모든데이터유형 | |
뛰어난확장성 | 뛰어난확장성 | |
$ | $ | |
毫升 | Bi, sql, ml,실시간앱 | |
뛰어난확장성 | SQL, R, Python등의언어로된파일에직접액세스하기위한개방형API | |
质量低,数据沼泽 | 酸트랜잭션을통한정적고품질데이터 | |
보에대한파일적용필수로거버넌스성능저해 | 테이블의행/열단위까지세분화된보및거버넌스 | |
낮음 | 높음 |
세계최초의유일한
클라우드레이크하우스플랫폼
AWS,微软Azure및谷歌云서비스로제공,관리되는砖레이크하우스플랫폼은데이터레이크에있는모든데이터를무한한수의데이터기반사용사례에사용할수있습니다。
데이터엔지니어는빠르고정적데이터파이프라을구축할수있습니다。비즈니스분석가는BI를수행하여대부분의데이터웨어하우스보다SQL쿼리를더빨리실행할수있습니다。데이터사이언티스트는MLOps를간소화할수있습니다。모든데이터팀이하나의공용플랫폼에서작업할때인프라스트럭처비용대폭절감,데이터팀생산성향상및혁신가속화를이룰수있습니다。
BI、SQL
데이터레이크에서직접분석
砖는데이터레이크에데이터분석을적용하여데이터레이크의경제적인가격으로데이터웨어하우스성능을제공합니다。
砖레이크하우스플랫폼은데이터고정(锁定)을방지하는오픈소스표준을사용하고데이터레이크에기본적으로부족한안정성,품질,성능을보유하고있어기존의클라우드데이터웨어하우스에비해최대6배높은가격대비성능을제공합니다。
데이터
엔지니어링
정적최신데이터를간편하게사용
砖는종단간(E2E)데이터엔지니어링솔루션(수집,처리및예약)을제공하여파이프라인을빌드,유지관리하고데이터레이크에서직접ETL워크로드를실행하는복잡한작업을자동화하므로데이터엔지니어는품질과안정성에주의를기울여가치있는인사이트를도출하는데집중할수있습니다。
스트림처리
내결함성을갖춘쉽고확장가능한스트림처리
데이터팀은砖를통해무한한데이터로부터실행가능한인사이트를지속해서추출하여적은비용으로서비스보장을제공할수있습니다。砖가지원하는사용사례스트리밍기능으로데이터팀은짧은레이턴시,확장성및내결함성을보유한실시간데이터기반애플리케이션을생성할수있습니다。
데이터사이언스및ml
머신러닝전체수명주기
砖는데이터사이언스및머신러닝을지원하는완전한오픈플랫폼을제공합니다。砖는고품질,고성능의데이터파이프라인과바로사용할수있는고급머신러닝기능을지원하여데이터및毫升팀이하나의통합플랫폼에서협업하고기능엔지니어링부터프로덕션에이르는전체머신러닝수명주기를가속화할수있도록도와줍니다。
일반보및관리
일반보및관리
砖는기존의클라우드네이티브보안정책으로보안을쉽게확장하고관리시스템을식별하여비공개방식,규정을준수하는격리된워크스페이스를창출하는기능과세분화된액세스제어를통해데이터를보호합니다。플랫폼관리자는엔드투엔드플랫폼경험을쉽게관리하고모든워크스페이스에서소비를제어할수있습니다。
데이터처리,관리,거버넌스
데이터처리,관리,거버넌스
砖는자동화되고안정적인ETL、개방적이고안전한데이터공유및클라우드서비스제공자를아우르는통일된접근방식을통해데이터관리를간소화하고비용효율성과확장성이높은레이크하우스의기반을형성합니다。
오픈데이터레이크
양질의정적데이터
데이터레이크에는항상방대한양의구조적,반구조적및비구조적데이터가들어있습니다。이제데이터레이크의개방성및유연성에강력한신뢰성과품질을결합하여모든분석사용사례에대한수요를대규모로지원하세요。
탐색
数据库에구축된레이크하우스계층탐색하기
데이터레이크에서직접분석
砖는데이터레이크에데이터분석을적용해데이터레이크의경제적인가격으로데이터웨어하우스성능을제공합니다。데이터고정(锁定)을방지하는오픈소스표준을사용하여砖레이크하우스플랫폼은데이터레이크에기본적으로부족한신뢰성과품질,우수한성능으로기존의클라우드데이터웨어하우스보다최대6배높은가격대비성능을제공합니다。
데이터레이크에서직접분석
砖는데이터레이크에데이터분석을적용해데이터레이크의경제적인가격으로데이터웨어하우스성능을제공합니다。砖레이크하우스플랫폼은데이터고정(锁定)을방지하는오픈소스표준을사용하고데이터레이크에기본적으로부족한안정성,품질,성능을보유하고있어기존의클라우드데이터웨어하우스에비해최대6배높은가격대비성능을제공합니다。
정적최신데이터를간편하게사용
砖는종단간(E2E)데이터엔지니어링솔루션(수집,처리및예약)을제공하여파이프라인을빌드,유지관리하고데이터레이크에서직접ETL워크로드를실행하는복잡한작업을자동화하므로데이터엔지니어는품질과안정성에주의를기울여가치있는인사이트를도출하는데집중할수있습니다。
머신러닝전체수명주기
砖는데이터사이언스및머신러닝을지원하는완전한오픈플랫폼을제공합니다。砖는고품질,고성능의데이터파이프라인과바로사용할수있는고급머신러닝기능을지원하여데이터및毫升팀이하나의통합플랫폼에서협업하고기능엔지니어링부터프로덕션에이르는전체머신러닝수명주기를가속화할수있도록도와줍니다。