アジャイルデータモデリング 組織にデータ分析を広めるためのテーブル設計ガイド

アジャイルデータモデリング 組織にデータ分析を広めるためのテーブル設計ガイド

ローレンス・コル (著), ジム・スタグニット (著), 株式会社風音屋 (翻訳, 監修)

★データ基盤やデータエンジニアリングにかかわるすべての人必携の一冊!★

・ディメンショナルモデリングのアジャイルなアプローチを解説した、隠れた名著“Agile Data Warehouse Design“の邦訳がついに登場!

・邦訳書を出版するにあたって、12件の国内事例を寄稿いただき、特別掲載!
ランサーズ株式会社/エイベックス株式会社/株式会社クラシコム/
株式会社商船三井/株式会社ビズリーチ/NE株式会社/学校法人 北陸大学/
国立大学法人 東京大学/株式会社リクルート/福岡地所株式会社/
住友化学株式会社/株式会社風音屋

【原書情報】
Agile Data Warehouse Design: Collaborative Dimensional Modeling, from Whiteboard to Star Schema
by Lawrence Corr with Jim Stagnitto
DecisionOne Press

【本書では、以下のトピックを学ぶことができます】
・ビジネスイベント分析とモデリングを使用したアジャイルなディメンショナルモデリング
・モデルストーミング:より速く、より包括的で、より生産的な、そしてより楽しいデータモデリング!
・7W(Who、What、When、Where、How Many、Why、How)を使ったディメンショナルなデータストーリー
・データストーリーを使う、具体例を用いたモデリング
・ビジュアルモデリング:タイムライン、チャート、表を作成し、複雑なプロセス測定をシンプルにモデル化
・アジャイルな設計文書:BEAM独自の省略記法を使ったスタースキーマの強化

【主な内容】
第1部 モデルストーミング
第1章 データウェアハウスのモデリング方法
第2章 ビジネスイベントのモデリング
第3章 ビジネスディメンションのモデリング
第4章 ビジネスプロセスのモデリング
第5章 スタースキーマのモデリング

第2部 ディメンショナルデザインパターン
第6章 誰が(Who)、何を(What):人と組織、製品とサービスのディメンションのためのデザインパターン
第7章 いつ(When)、どこで(Where):時間と場所のディメンションのためのデザインパターン
第8章 どれくらい(How Many):高性能なファクトテーブルと柔軟な指標のためのデザインパターン
第9章 なぜ(Why)、どのように(How):原因と結果のディメンションのためのデザインパターン

事例集 日本語版によせて

本書は、まさに「組織にデータ分析を広めるためのテーブル設計ガイド」です。ガイドなので、必要な時に必要なところを見るとよいと思います。

しかし優秀なデータエンジニアになるためには、各章のまとめのところはしっかり理解して、頭に入れておくことが必要だと思います。

特に重要だと思うところ、データサイエンティスト的な立場からデータエンジニアに分かっておいてほしいところ的な観点で重要なポイントをピックアップしていきたいと思います。

BEAM*:
Business, Event, Analysis & Modelingの略で、その名の通り、ビジネスイベントに基づいたデータ要件分析とデータモデリングを組み合わせた手法

7W:

7W データ ディメンションやファクトの例
誰が(Who) 人、組織 従業員、顧客
何を(What) モノ 製品、サービス
いつ(When) 時間 日付、時刻
どこで(Where) 場所 店舗、病院、配送先
なぜ(Why) 理由、因果 昇進、天気
どのように(How) トランザクションID,ステータスコード 注文ID、通話状態
どれくらい(How Many) 指標、KPI 売上高、数量(ファクト)

 

第1章

データウェアハウスシステムと業務システムは根本的に違うものです。両者には根本的に異なるデータ要件があり、全く異なる思考になる手法でモデル化されるべきです。

第2章

BEAM*モデラーは7Wを使ってビジネスイベントを発見し、そのタイプ、粒度、ディメンション、指標を記録します。これらは、ファクトテーブルを設計する上で必要な情報をすべて網羅します。

第5章

「(データウェアハウスの)サロゲートキー」をディメンションの主キーとして使用することで、ビジネスキーからデータウェアハウスを独立させ、ディメンションの柔軟性(SCD、欠損値、マルチレベルディメイションなるの管理)を提供し、クエリ効率を上げられます。
※サロゲートキー:システムが振る連番など
※SCD:Slowly Changing Dimension、緩やかに変化するディメンション

 

データエンジニアの方たちはAI-Readyのデータウェアハウスを意識しながら、この本を座右の書して現場に役立つデータウェアハウスを構築し、データサイエンティストやデータエンジニアの業務効率化や分析発想力の醸成に寄与していってほしいと思います。期待しています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください