スタ,スキ,マ
用語集のトップペ,ジへスタ,スキ,マとは
スタ,スキ,マとは,データベース内のデータを整理することで理解・分析しやすくなった多次元データモデルで,データウェアハウスやデータベース,データマート,その他のツールに適用できます。スタ,スキ,マの設計は,大規模なデ,タセットへのクエリを実行するために最適化されています。
1990年代にラルフ・キンボールによって発表されたスタースキーマは,反復的なビジネス定義の重複を減らすことによってデータの保存や履歴の管理,データの更新を効率的に行い,データウェアハウスでのデータの集計やフィルタリングを高速に行うことができます。
ファクトテ,ブルとディメンションテ,ブル
スタースキーマは,ビジネスデータをディメンション(時間や商品など)とファクト(金額や数量のトランザクションなど)に非正規化するために使用されます。
スタースキーマの中央には1つのファクトテーブルがあり,ビジネスのファクト(金額や数量のトランザクションなど)が格納されています。ファクトテーブルは,時間や製品などのディメンションに沿って,他の複数のディメンションテーブルに接続されています。スタ,スキ,マでは、2 つ以上のファクトテーブルとディメンションテーブルを結合することで、ユーザーが適切と考える方法でデータをスライスすることやダイスにすることを可能にします。
非正規化デ,タ
スタースキーマは,一部のディメンションテーブルに冗長なカラムを追加することで,データのクエリや作業を高速化・簡略化しデータを非正規化します。その目的は,データモデルの冗長性(データの重複)を許容することで計算コストのかかる結合演算を回避し,クエリの速度を向上させることにあります。
このモデルでは,ファクトテーブルは正規化されていますが,ディメンションテーブルは正規化されていません。すなわち,ファクトテーブルのデータはファクトテーブル上にのみ存在しますが,ディメンションテーブルには冗長なデータが含まれる可能性があります。
スタ,スキ,マのメリット
- スタ,スキ,マのようなファクト/ディメンションモデルは,理解も実装もシンプルで,エンドユザは必要なデタを容易に見けられます。また,デ,タマ,トやその他のデ,タリソ,スに適用できます。
- スノーフレークスキーマのような正規化されたモデルと比較して,スタースキーマはデータにアクセスする際の結合への依存度が低いため,単純なクエリに最適です。
- Olapモデルによく適合します。
- スタ,スキ,マは,計算コストのかかる結合を避けようとするため,正規化されたデ,タと比較してクエリのパフォ,マンスが向上します。
スタ,スキ,マと3nfの違い
3nf(第3正規形)とは,正規化によってデータの冗長性を減らす手法であり,完全に正規化されたとみなされるデータベースの標準規格です。デ,タの正規化により,スタ,スキ,マと比べて多くのテ,ブルを持,のが一般的です。一方で,大規模なテ,ブル間の結合が増えるため,クエリが複雑になる傾向があります。
関連リソ,ス
- ブログ:データウェアハウスのモデリング手法と砖レイクハウスプラットフォームへの実装
- ブログ:三角洲湖で砖にスタースキーマを実装するための簡単な5ステップ
- Databricks SQL製品ペ,ジ
- 用語集:スノ,フレ,クスキ,マ
用語集のトップペ,ジへ