ローレンス・コル (著), ジム・スタグニット (著), 株式会社風音屋 (翻訳, 監修)
| ★データ基盤やデータエンジニアリングにかかわるすべての人必携の一冊!★
・ディメンショナルモデリングのアジャイルなアプローチを解説した、隠れた名著“Agile Data Warehouse Design“の邦訳がついに登場! ・邦訳書を出版するにあたって、12件の国内事例を寄稿いただき、特別掲載! 【原書情報】 【本書では、以下のトピックを学ぶことができます】 【主な内容】 第2部 ディメンショナルデザインパターン 事例集 日本語版によせて |
本書は、まさに「組織にデータ分析を広めるためのテーブル設計ガイド」です。ガイドなので、必要な時に必要なところを見るとよいと思います。
しかし優秀なデータエンジニアになるためには、各章のまとめのところはしっかり理解して、頭に入れておくことが必要だと思います。
特に重要だと思うところ、データサイエンティスト的な立場からデータエンジニアに分かっておいてほしいところ的な観点で重要なポイントをピックアップしていきたいと思います。
BEAM*:
Business, Event, Analysis & Modelingの略で、その名の通り、ビジネスイベントに基づいたデータ要件分析とデータモデリングを組み合わせた手法
7W:
| 7W | データ | ディメンションやファクトの例 |
| 誰が(Who) | 人、組織 | 従業員、顧客 |
| 何を(What) | モノ | 製品、サービス |
| いつ(When) | 時間 | 日付、時刻 |
| どこで(Where) | 場所 | 店舗、病院、配送先 |
| なぜ(Why) | 理由、因果 | 昇進、天気 |
| どのように(How) | トランザクションID,ステータスコード | 注文ID、通話状態 |
| どれくらい(How Many) | 指標、KPI | 売上高、数量(ファクト) |
第1章
データウェアハウスシステムと業務システムは根本的に違うものです。両者には根本的に異なるデータ要件があり、全く異なる思考になる手法でモデル化されるべきです。
第2章
BEAM*モデラーは7Wを使ってビジネスイベントを発見し、そのタイプ、粒度、ディメンション、指標を記録します。これらは、ファクトテーブルを設計する上で必要な情報をすべて網羅します。
第5章
「(データウェアハウスの)サロゲートキー」をディメンションの主キーとして使用することで、ビジネスキーからデータウェアハウスを独立させ、ディメンションの柔軟性(SCD、欠損値、マルチレベルディメイションなるの管理)を提供し、クエリ効率を上げられます。
※サロゲートキー:システムが振る連番など
※SCD:Slowly Changing Dimension、緩やかに変化するディメンション
データエンジニアの方たちはAI-Readyのデータウェアハウスを意識しながら、この本を座右の書して現場に役立つデータウェアハウスを構築し、データサイエンティストやデータエンジニアの業務効率化や分析発想力の醸成に寄与していってほしいと思います。期待しています。
