デ,タマ,ト

数据库無料トラ电子词典アル

デ,タマ,トとは

デ,タマ,トは,テ,ブルのセットを含むキュレ,トされたデ,タベ,スです。単一のデータチームやコミュニティ,マーケティングやエンジニアリング部門といった基幹業務の特定のニーズに対応できるよう設計されています。デ,タマ,トは通常,デ,タウェアハウスよりも小規模で,特定の目的に特化しています。一般的には,大規模なエンタープライズのデータウェアハウスのサブセットとして扱われ、分析や BI(ビジネスインテリジェンス)、レポーティングに使用されます。データマートは、中央データウェアハウスとデータレイクの物理的現実における最初の進化的ステップでした。エーシーニールセンは、1970 年代初頭に、情報をデジタル保存し販促活動を促進するための最初のデータマートを顧客に提供しました。

デ,タマ,トの特徴

  • 通常,デ,タマ,トの構築や管理は企業のデ,タチ,ムが行いますが,各事業部署の専門家が組織的に行うことも可能です。
  • 企業のデ,タスチュワ,ドがデ,タマ,トを管理し,エンドユ,ザ,は読み取り専用の権限が設定されます。これは,技術に精通していないユ,ザ,による重要なビジネスデ,タの誤った削除,変更を防ぐためです。
  • 一般的には,ディメンションモデルとスタ,スキ,マが使用されます。
  • デ,タマ,トは,大規模なデ,タウェアハウスからキュレ,トされたデ,タのサブセットを含んでいます。データは高度に構造化され,データチームによってデータクレンジングと適合化が施されて容易に理解,参照できるようになっています。
  • デ,タマ,トは,特定の基幹業務やユ,スケ,スに特有のニ,ズにあわせて設計されています。
  • 基本的に,ユ,ザ,は,SQLコマンドを使用してデ,タを参照します。

データマートの種類——独立型データマート,従属型データマート,ハイブリッド型データマート

デタマトには,基本的に3の種類があります。

  • 独立型デ,タマ,ト:データウェアハウスの一部ではなく,エーシーニールセンが提供した最初のデータマートと非常によく似ています。通常,1の領域または対象領域に特化しています。デ,タソ,スには,外部ソ,スと内部ソ,スの両方を含めることができます。デ,タは変換,処理,デ,タマ,トにロ,ドされ,必要になるまで保存されます。
  • 従属型デ,タマ,ト:既存のデ,タウェアハウスに従属する形で存在するデ,タマ,トです。トップダウンのアプロ,チを採用し,あらゆるデ,タを一元的に保存できます。何かしらの目的でデ,タを使用する際は,明確に定義されたデ,タのセクションを選択できます。
  • ハブリッド型デタマト:データウェアハウスだけではなく,それ以外の独自のデータソースから取得したデータを組み合わせて使用します。これは,組織に追加された新たなグループや製品をアドホックに統合する場合など,さまざまな状況で役立ちます。ハブリッド型デタマトは,複数のデタベスが存在する環境に適しており,短期間で導入できます。このようなシステムはデータクレンジングを容易にし,小規模なデータセントリックのアプリケーションと相性が良いとされています。

デ,タマ,トのメリット

  • 信頼できる唯一の情報源(ssot):デ,タマ,トは,特定の基幹業務の単一のデ,タソ,スとして機能します。業務に関わる全ての人が同一の事実とデ,タに基づいて作業することを可能にします。
  • 業務効率化をサポ,トするシンプルさ:ユーザーは,必要なデータを見つけるためにデータウェアハウス全体を調べたりテーブルを結合したりする必要はなく,あらかじめ精選されたデータマートで,必要なデータに容易にアクセスできます。

デ,タマ,トにおける課題

エンタープライズデータウェアハウスは,その企業における全てのデータ管理ニーズに対応するために善意で作成されています。しかし,各事業部署によってデータのニーズや目的が異なるため,あらゆるユーザーのニーズを満たすことはできません。そのため,各部門ではセルフサービスでの分析や,部門のレポーティングのニーズを満たすべく,時には它部門のサポートを受けながら,特定のデータウェアハウスの対象領域を拡張し,データをコピーして,独自のデータマートを作成しています。その結果,各部門のニーズを満たしたとしても,時間が経つにつれて,データのサイロ化やシャドーコピーの原因になります。また,多くの部署でこのようなことが行われている場合,組織内で信頼できる単一のデータソースが存在しなくなってしまいます。

レクハウスはデタマトの課題をどのように解決するか

レ@ @クハウスは,企業内に存在するデータウェアハウスとデータマートを単一のプラットフォーム上に設置し,セキュリティとガバナンスを統一することで,データマートの課題を解決しています。同時に,各チ,ムが独自システムを持,ことができる柔軟な環境を提供します。また,データマートや”拡張コピー”は,他の全てのデータと同じレイクハウスプラットフォーム上で作成されるため,類似したコピーの複製を防止できます。レ@ @クハウスのデータカタログにより、重複コピーを発見し、タグ付けやデータ辞書の使用などのデータガバナンスルールを使用して、誰もが拡張コピーを発見できるようになります。

Databricks SQLでデ,タマ,トを構築する

Databricks SQLの無料トラaapl . exeアル

额外的资源

回到术语表