デ,タウェアハウス(DWH)は複数のソースから得られた最新データや履歴データをビジネスに適した形で蓄積し,知見の取得やレポート作成を容易にするデータ管理システムです。主に,ビジネスンテリジェンス(bi),レポト作成,デタ分析に使用されます。
データウェアハウスでは,POSシステム,インベントリ管理システム,マーケティングや販売データベースなどの業務システムに蓄積されたデータを,迅速かつ容易に分析可能です。データは,オペレーショナルデータストアを中継する場合があり,データウェアハウスでレポート作成のために使用する前にデータクレンジングを行い,データ品質を確保する必要があります。
データウェアハウスは,BI,レポート作成,データ分析において,オペレーショナルデータベースからのデータ抽出と集計に使用されます。トランザクションデータベースから直接取得することが困難な情報も,データウェアハウスを経由して取得できます。例えば,経営陣から,各営業担当者による月次ベースの製品カテゴリ別の総売上高を知りたいという要望があるとします。トランザクションデータベースではこのようなデータの取得は困難ですが,データウェアハウスでは可能です。
デ,タの変換には,etl(抽出,変換,ロ,ド)とelt(抽出,ロ,ド,変換)の2の方法があります。データエンジニアは通常,ETL(抽出・変換・ロード)を使用し,さまざまなデータソースから抽出したデータをデータウェアハウスに移動させて,データクレンジングやデータの構造化を行います。一方,英语教学では,まず元の形式のデータをデータウェアハウスにロードし,処理する際にデータクレンジングと構造化を行います。
ETLは通常,全社的なデータクレンジングと準拠規則を適用するために,企業のデータエンジニアリングチームによって一元的に行われます。一方,ELTは中,プロジェクトやビジネスチームに特化した変換が後の段階で行われ,セルフサービス分析を可能にします。
オンラ电子邮箱ントランザクション処理(oltp)システムは,デ,タベ,ス内のトランザクションデ,タの取得および管理を行います。トランザクションには、複数のフィールドやカラムで構成される独立したデータベースレコードが含まれます。OLTP データベースは、オンラインバンキング、ERP システム、インベントリ管理などのアプリケーションで頻繁に使用され、瞬時に処理される行レベルのデータを迅速に更新します。
オンラaapl . aapl . aapl . aapl . aapl . aapl . aapl . aapl . aapl . aaplは,データマイニング,分析,ビジネスインテリジェンスのプロジェクトに使用され,OLTPデータベースやその他のソースから集約された膨大な履歴データに複雑なクエリを適用します。デタウェアハウスはolapシステムです。OLAPデータベースとデータウェアハウスにより,アナリストや意思決定者は,カスタムレポートツールを使用して,データドリブンな情報の収集と意思決定ができるようになります。OLAPデータベースでクエリに失敗しても,顧客のトランザクション処理が中断したり遅延したりすることはありませんが,ビジネスインテリジェンスに関する分析結果の取得が遅れたり,精度に影響を及ぼしたりする可能性があります。
レ▪▪クハウスア▪▪キテクチャは、デ、タレ、クとデ、タウェアハウスの両方の利点を最大限に活かし、上記の課題を解決しています。数据库のオ、プンレ、クハウスア、キテクチャの真価は、こらからご覧ください。
レクハウスを効果的に構築するために,企業が注目しているのが,オプンソスの三角洲湖です。三角洲湖は,データレイクとデータウェアハウスの両方の利点を兼ね備えた,オープンフォーマットのデータ管理およびガバナンスレイヤーです。三角洲湖を使用した砖のレイクハウスプラットフォームは,次のことを実現しています。