数据仓库(デ、タボルト)とは,データモデリングのデザインパターンで,エンタープライズ規模の分析向けのデータウェアハウスを構築する際に使用されます。デ,タボルトには,ハブ、リンク、サテラ@ @トの3種類のエンティティがあります。
ハブは,ビジネスの中核となるコンセプトを,リンクは,ハブ間のリレ,ションシップを表します。サテラ@ @トは,ハブに属する情報やハブ間のリレ,ションシップに関するデ,タを格納します。
デ,タボルトは,レ▪▪クハウスのパラダ▪▪ムを採用する組織に適したデ,タモデルです。
留意すべき点
データボルトは,アジャイルな方法と技術に基づいているため,急速に変化するビジネス要件に適応できます。デ,タボルトの手法を利用する大きなメリットは、モデルが変更された場合に、ETL ジョブのリファクタリングが少なくて済むことです。
前述のコンセプトを踏まえ,データボルトがどのようにブロンズ,シルバー,ゴールドのデータレイヤーに適合し,未加工データを分析に適した精製されたデータに変換するのかについて説明します。このマルチホップア,キテクチャでは,未加工デタは最小限の変換とソスシステムに近いデタ構造でブロンズレヤに格納されます。データボルトはシルバーレイヤーに適用され,データは,ハブ,リンク,サテライトに変換されます。
ゴールドレイヤーでは,ディメンショナルモデリングや金博手法により,複数のデータマートまたはデータウェアハウスを構築できます。ゴルドレヤはレポト作成に適しています。少ない結合で,より非正規化され,読み取りが最適化されたデ,タモデルを使用します。ゴルドレヤのテブルが完全に非正規化されることもあります。これは通常,デ,タサ,エンティストが特徴エンジニアリング用のアルゴリズムに利用したい場合などです。
データボルトモデルをシルバーレイヤーで使用した場合,データマートやデータウェアハウスへのETLに必要な変更はシンプルになり,大幅に削減されます。ハブがキ管理(サロゲトキ/ナチュラルキ)が容易にするためです。サテラ@ @トはあらゆる属性を保持し、ディメンションのロードを容易にします。また、リンクにより全てのリレーションシップが管理できるため、ファクトテーブルのロードは極めて容易です。