これまでの歩み

デ,タウェアハウスから
脱却のとき

データウェアハウスは,CD,使い捨てカメラ,フロッピーディスクをはじめとする40年前のイノベーションと同様に,大きな成功を収めました。しかし今,新たなユ,スケ,スが新たなテクノロジ,の創出を牽引しています。CDはストリ,ミング配信ができません。フィルム式カメラでは写真の共有ができません。フロッピディスクは,無限大の容量を持クラウドストレジとは比較にもなりません。同様に,デ,タウェアハウスではaiを実行できません。

シンプルに

艾は,あらゆる組織において重要な課題となっています。しかし,複雑で陳腐化した従来のaaplンフラでは,aiに求められる価値を実現できません。現在のニ,ズを満たし,か,将来を見据えた新たなデ,タア,キテクチャへの移行が必要です。

发现
Lakehouse
レ@ @クハウスの夜明け

デタとaiの新たな時代へ

データレイクハウスは,データウェアハウスとデータレイクが持つ最良の要素を単一のプラットフォームで実現するオープンデータアーキテクチャです。

構造化,半構造化,非構造化を問わず,あらゆるデータをオープンデータレイクに保存すると同時に,データウェアハウスの利点であるデータの品質,性能,セキュリティ,ガバナンスを維持します。レイクハウスは,ビジネスインテリジェンス(BI), SQL分析,リアルタイムのデータアプリケーション,データサイエンス,機械学習を単一のプラットフォームでサポートする唯一のデータアーキテクチャです。

レ@ @クハウスの構造

単一のプラットフォ,ムが
あらゆるユ,スケ,スをサポ,ト

三角洲湖

カギとなる要素

三角洲湖は,データレイクに信頼性,セキュリティ,性能をもたらすオープンソースプロジェクトであり,Amazon S3, Azure湖存储数据,谷歌云存储などの既存のストレージシステム上でのレイクハウス構築のための重要な役割を担っています。

三角洲湖のデ,タはオ,プンフォ,マットで保存されます。そのため,オープンソースの広範なエコシステムへのアクセスが可能になり,独自のフォーマットによるデータのロックインを回避できます。数千の企業が毎月数エクサバトのデタを德尔塔湖で処理しています。


三角洲湖にいて詳しく見る→

hex-bg

レ@ @クハウスを比較

DWHにない機能を提供

レクハウスはデタウェアハウス(dwh)の限界を解決します。あらゆる種類のデ,タを扱うと同時に、従来の DWH ワークロードと機械学習をネイティブにサポートします。既存のデータレイクの機能を補完し、あらゆるデータとあらゆるユースケースをサポートする単一のオープンシステムを構築します。

デ,タウェアハウス レ@ @クハウス
デ,タフォ,マット
デ,タフォ,マット クロ,ズド オプン
デ,タの種類
デ,タの種類 構造化デタ* . あらゆる種類のデ,タ
スケ,ラビリティ
スケ,ラビリティ 限定的** 高度なスケ,ラビリティ
コスト
コスト $ $ $
ユ,スケ,ス
ユ,スケ,ス bi, sql bi, sql, ml,リアルタescムアプリ
デ,タアクセス
デ,タアクセス SQLのみ SQL, R, Pythonその他の言語でファaapl . exeルへの直接アクセスを可能にするオ
信頼性
信頼性 酸トランザクションによる高品質,高信頼性デ,タ 酸トランザクションによる高品質,高信頼性デ,タ
ガバナンス
ガバナンス テブルの行/列レベルの高粒度のセキュリティとガバナンス テブルの行/列レベルの高粒度のセキュリティとガバナンス
性能
性能

*半構造化デ,タは限定的にサポ,ト
**スケリングでコストは爆発的に増大

データウェアハウスの父と称されるビル・インモン(Bill Inmon)氏推奨

ビル·电子书电子书ンモン氏による构建数据湖屋(デタレクハウスの構築)”

本の表紙

デタレクを変える

レ▪▪クハウスは,デ▪▪タレ▪▪クがスワンプ化する根本的な要因を解決します。デタレクに、トランザクション、スキーマ、ガバナンスなど、DWH の持つ主要な機能を補完してデータ品質を向上させ、さらに、複数の手法を用いた性能の最適化により分析を高速化します。オープンデータレイクにデータ管理機能や性能の最適化がもたらされ、レイクハウスが BI・ML アプリケーションをネイティブにサポートします。

デタレク レ@ @クハウス
デ,タフォ,マット
デ,タフォ,マット オプン オプン
デ,タの種類
デ,タの種類 あらゆる種類のデ,タ あらゆる種類のデ,タ
スケ,ラビリティ
スケ,ラビリティ 高度なスケ,ラビリティ 高度なスケ,ラビリティ
コスト
コスト
ユ,スケ,ス
ユ,スケ,ス 毫升 bi, sql, ml,リアルタescムアプリ
デ,タアクセス
デ,タアクセス 高度なスケ,ラビリティ SQL, R, Pythonその他の言語でファaapl . exeルへの直接アクセスを可能にするオ
信頼性
信頼性 低品質,デ,タスワンプ 酸トランザクションによる高品質,高信頼性デ,タ
ガバナンス
ガバナンス ファesc escルレベルのセキュリティで,ガバナンスが弱い テブルの行/列レベルの高粒度のセキュリティとガバナンス
性能
性能

データウェアハウスの父と称されるビル・インモン(Bill Inmon)氏推奨

ビル·电子书电子书ンモン氏による构建数据湖屋(デタレクハウスの構築)”

本の表紙

数据库のレ电子词典クハウス

世界初,唯一のクラウド型レ

砖のレイクハウスプラットフォームは,AWS,微软Azure,谷歌云をサポートしており,クラウド上のサービスとして管理されます。。

高速で信頼性の高いデータパイプラインの構築を可能にしてデータエンジニアを支援し,従来のデータウェアハウスよりも高速なSQLクエリによるBIを可能にしてデータアナリストを支援します。デタサエンティストはMLOpsを効率化できます。データに関わる全てのチームが1つのプラットフォームを共有することで,インフラコストが大幅に低減し,生産性がアップし,イノベーションが加速します。

bi, sql
デタレクのデタを直接分析

砖は,データレイクでのデータ分析を可能にし,データウェアハウスの性能をデータレイクの経済性で提供します。数据库のレ电子词典クハウスプラットフォ,ムは、オープンソーススタンダードを活用することでデータのロックインを回避し、データレイクに本来欠けている信頼性、品質、性能を補完し、従来のクラウドデータウェアハウスに比べて最大 6 倍の価格性能を実現します。

デ,タエンジニアリング
デ,タの鮮度と信頼性を容易に確保

砖は,データの取り込み,処理,スケジューリングなど,エンドツーエンドのエンジニアリングソリューションを提供します。パイプラインの構築と管理を自動化し,データレイク上でのETLワークロードの直接実行を可能にします。これにより,データエンジニアはデータの品質と信頼性を高めることに注力できるようになり,知見の抽出が加速します。

ストリ,ミング処理
シンプルでスケ,ラブルな,耐障害性に優れたストリ,ミング処理

データチームは,処理を中断することなく膨大なデータから有用な知見を抽出し,わずかなコストでサービスを保証できます。また,砖をストリーミングのユースケースに利用することで,低レイテンシでスケーラブルかつ耐障害性に優れた,データドリブンのリアルタイムアプリケーションを構築できます。

デタサエンス·ml
機械学習のフルラ▪▪フサ▪▪クル

砖は,データサイエンスと機械学習のための完全でオープンなプラットフォームを提供します。砖は、高品質、高性能データパイプラインと高度な機械学習の機能を、すぐに利用できる状態で提供します。統合プラットフォームがデータチームと ML チームのコラボレーションを支援し、特徴量エンジニアリングから本番運用まで、ML ライフサイクル全般を効率化します。

基本的なセキュリティ·管理
オプンデタレクのロゴ
基本的なセキュリティ·管理

砖により,高粒度のアクセス制御によるデータ保護および,既存のクラウドネイティブなセキュリティポリシーや認証情報管理システムを使用したセキュリティの拡張が可能になり,プライバシーとコンプライアンスが確保され,隔離されたワークスペースを構築できます。プラットフォーム管理者は,エンドツーエンドのエクスペリエンスを容易に管理し,各ワークスペースのコストを制御できます。

デ,タ処理,管理,ガバナンス
オプンデタレクのロゴ
デ,タ処理,管理,ガバナンス

自動化された信頼性の高いETL、オープンでセキュアなデータ共有,主要なクラウドを包括的にサポートするガバナンスにより,砖はデータ管理をシンプルにし,コスト効率とスケーラビリティに優れたレイクハウスの基盤を提供します。

オプンなデタレク
オプンデタレクのロゴ
デ,タスワンプからの脱却

組織における現行のデタレクには,既に多くの構造化,半構造化,非構造化デタが保存されています。デタレクのオープン性と柔軟性に、堅固な信頼性と品質を融合させ、あらゆる分析ユースケースの大規模なニーズをサポートします。

发现!

マウスオバでDatabricksレクハウスの各階層の説明が表示されます。

デタレクのデタを直接分析

砖は,データレイクでのデータ分析を可能にし,データレイクの経済性でデータウェアハウスの性能を提供します。数据库のレ电子词典クハウスプラットフォ,ムは、オープンソーススタンダードを活用することでデータのロックインを回避し、データレイクに本来欠けている信頼性、品質、性能を補完し、従来のクラウドデータウェアハウスに比べて最大 6 倍の価格性能を実現します。

デタレクのデタを直接分析

砖は,データレイクでのデータ分析を可能にし,データウェアハウスの性能をデータレイクの経済性で提供します。数据库のレ电子词典クハウスプラットフォ,ムは、オープンソーススタンダードを活用することでデータのロックインを回避し、データレイクに本来欠けている信頼性、品質、性能を補完し、従来のクラウドデータウェアハウスに比べて最大 6 倍の価格性能を実現します。

デ,タの鮮度と信頼性を容易に確保

砖は,データの取り込み,処理,スケジューリングなど,エンドツーエンドのエンジニアリングソリューションを提供します。パイプラインの構築と管理を自動化し,データレイク上でのETLワークロードの直接実行を可能にします。これにより,データエンジニアはデータの品質と信頼性を高めることに注力できるようになり,知見の抽出が加速します。

データチームは,処理を中断することなく膨大なデータから有用な知見を抽出し,わずかなコストでサービスを保証できます。また,砖をストリーミングのユースケースに利用することで,低レイテンシでスケーラブルかつ耐障害性に優れた,データドリブンのリアルタイムアプリケーションを構築できます。

機械学習のフルラ▪▪フサ▪▪クル

砖は,データサイエンスと機械学習のための完全でオープンなプラットフォームを提供します。砖は、高品質、高性能データパイプラインと高度な機械学習の機能を、すぐに利用できる状態で提供します。統合プラットフォームがデータチームと ML チームのコラボレーションを支援し、特徴量エンジニアリングから本番運用まで、ML ライフサイクル全般を効率化します。

三角洲湖砖により,高粒度のアクセス制御によるデータ保護および,既存のクラウドネイティブなセキュリティポリシーや認証情報管理システムを使用したセキュリティの拡張が可能になり,プライバシーとコンプライアンスが確保され,隔離されたワークスペースを構築できます。プラットフォーム管理者は,エンドツーエンドのエクスペリエンスを容易に管理し,各ワークスペースのコストを制御できます。

三角洲湖自動化された信頼性の高いETL、オープンでセキュアなデータ共有,主要なクラウドを包括的にサポートするガバナンスにより,砖はデータ管理をシンプルにし,コスト効率とスケーラビリティに優れたレイクハウスの基盤を提供します。

高品質,高信頼性のデ,タ組織における現行のデタレクには,既に多くの構造化,半構造化,非構造化デタが保存されています。デタレクのオープン性と柔軟性に、堅固な信頼性と品質を融合させ、あらゆる分析ユースケースの大規模なニーズをサポートします。
導入事例

多くのグロ,バル企業が
レ@ @クハウスに移行しています