データスチュワードシップ データマネジメント&ガバナンスの実践ガイド

データスチュワードシップ データマネジメント&ガバナンスの実践ガイド

編著:David Plotkin
監訳:Metafindコンサルティング株式会社

 データスチュワードシップは、データを信頼できる、高品質なものにし続ける取り組みです。ビッグデータそしてAI(人工知能)の時代になり、あらゆる組織にデータスチュワードシップが求められています。

『データマネジメント知識体系ガイド第二版(DMBOKガイド)』は第3章で担い手であるデータスチュワードの重要性を指摘しています。そこに発言を引用されているDavid Plotkin氏はこのテーマの第一人者であり、著書“Data Stewardship”はロングセラーになっています。

本書は“Data Stewardship”の第二版の邦訳であり、日本で初のデータスチュワードシップ書籍になります。データスチュワードシップの導入と運用に関する明確かつ簡潔、そして実践的なアドバイスとガイドラインを提供します。ガイドラインを見れば組織の構造、ビジネス機能、データ所有権に基づき、どう進めていけばよいかが分かります。Plotkin氏が様々な企業の現場で実践してきたノウハウが多くの成果物の例とともに紹介されています。

第二版で次の点が強化されました。

●グローバルビジネス:国際企業向けの体制をより詳しく解説。国の違いを考慮したビジネス用語の構成など。
●プライバシー規制:国内外のプライバシー規制の実施に関与するデータスチュワードシップを解説。
●ビッグデータとデータレイク:非構造データも含めたデータガバナンスの在り方を提示。
●プロジェクトマネジメント(PM):データガバナンスのPM方法論への統合を提唱。WBSにデータガバナンスのタスクを追加。
●データドメイン:ビジネス/組織機能からデータドメインへの移行を提案。推奨されるデータドメイン詳細を提示。データドメインの長所と短所も説明。

<目次>

1章 データスチュワードシップとデータガバナンス
2章 データスチュワードのタイプ
3章 データスチュワードの役割と責任
4章 データスチュワードシップの導入
5章 ビジネスデータスチュワードのトレーニング
6章 データスチュワードシップの実践
7章 データスチュワードの重要な役割
8章 データスチュワードシップ進捗の計測
9章 データスチュワードシップ成熟度
10章 ビッグデータとスチュワードシップ
11章 データドメインの利用

スチュワードとは「執事」という意味。冒頭に翻訳者序文があるのですが、これは読まなきゃとモチベーションを掻き立てられる内容です。

データスチュワードシップとは、データオーナー本人に代わって、資産であるデータとして何があるのかを把握し、データを効率よく利用できる状態とし、そのための環境を整え、その状態と環境を長期に維持する活動を指す。                

世界的に見ると、データのマネージメントとスチュワードシップが明確に使い分けられ、それぞれの活動が浸透している。一方、日本では、これまでデータスチュワートシップへの関心は低く、本来なら、複数のデータスチュワードが分担すべき役割を、データ関連職が兼任することが多い。IT寄りのデータアーキテクトやデータエンジニアが、特定の業務領域のデータスチュワードの役割を兼ねることも、多くの企業で見られる。

しかし、ビック出た時代を経て、AIの時代に入った今、組織が扱うデータの量は膨大になり、さらに種類と質はあまりにも多様である。データ活用にはビジネスへの直接的な貢献が求められ、ビジネス知識と高いデータ品質が要求されている。こうした状況下で、データの環境整備をデータアーキテクトなどが原因で対応するのは、負荷が大きすぎる。負荷を軽減するための様々なツールやアプリケーションも開発され、導入が進んでいるが、日本ではそうした道具を使いこなす知識と、その知識を持つデータスチュワートが全く取れていない。

日本でもデータカタログの導入が盛んになり、メタデータマネージメントが注目を浴びている。ただ、IT主導でツールの導入が優先され、導入したものの、どんなメタデータをどうやって誰が管理するのか決められず、結果としてツールの利用も定着しない現実がある。(pp.4-5)

下記の問題提起は納得させられる企業に存在するよくある問題で、根が深く分かっていても改善できないところな気がします。

問題提起

データを扱う際には以下のような多くの課題に直面せざるを得ない。

  • データーはそれ自体を説明しない。データの意味、正しい使い方、データの品質が良いかどうかの評価方法など、データの解釈を誰かが提供しなければならない。
  • データは様々な目的のために、多くの人によって共有され利用される。では、誰がそれを所有しているのか。そのデータが「誤り」であるときに、誰がそれについて意思決定し、責任を負うのか。
  • データを使用する多くのプロセスは、その上流にいる人々が「正しく処理する」ことによって成り立っている。しかし「正しい」と言えるのは誰か。そして「誤り」である時、誰がそれを判断できるのか。
  • 要件定義、分析、設計、構築、そしてデータ活用といったソフトウェア開発ライフサイクルは、多くの引き継ぎを必要とする。この引き継ぎがデータを破損させ、データ品質を危険にさらすリスクがある。そうした場面は数多い。
  • データの実装を担当する技術者は、データの意味や使い方に精通しているわけではない。
  • 私たちデータコミュニティーには長い歴史と習慣があり、データの意味とデータの内容の両方において、曖昧さを許容してきた。

これらすべての要因により、データの理解が不十分となり、品質が悪いと言う認識が生まれ、そうした違いを理解する能力も乏しくなる、データの誤ったマネージメントにもつながり、プライバシー保護や消費者の権利に関する厳格なルールを定めた、新しい法規制に抵触するようなことになる。(p.15)

データガバナンス、データスチュワードシップ、データマネージメントの関係性については下記のように定義しています。

データガバナンスの取り組みの一環として、企業全体で正式にデータスチュワードシップを実施する事はデータマネージメントを実施し、これらの課題を解決する上で極めて重要である。データスチュワードシップによって、組織はデータを資産として扱えるようになる。他の資産と同様に、データを目録を作成し、所有し、賢く使用し、マネージメントし理解しなければならない。(p.16)

Geminiに聞いてみたのですが、分かりやすい回答をしてくれました。

データガバナンスが、データに関する大枠のルールを定める「憲法」のようなものだとすると、データマネジメントは、その憲法に基づいた「法律」に相当し、データスチュワードシップは、法律を執行する「警察官」のような役割です。

データガバナンスが、企業全体のデータに関する戦略的な方向性を示し、データマネジメントが、その戦略を実行するための具体的な活動を行い、データスチュワードシップが、データの品質や利用状況を管理することで、データガバナンスの実現をサポートします。

データオーナーシップを確立するには、そのデータの収集方法と利用者を把握し、そのデータエレメントの内容と品質に最も責任を負うのは誰かを決定する。最後に、データを確実に使用するためには、そのデータがどう作成されたのか、何のために作成されたのか、今後起こりうる新たな状況、さらに現在そのデータが使用されている状況でも、使用するのに適しているかどうか、といったことを把握し、マネジメントする必要がある。(p.16)
ビジネスデータスチュワードは通常、データをよく知り、データと密接に関わっている人である。「データアナリスト」や「ビジネスアナリスト」といった肩書を持つ人がビジネスデータスチュワードに適していることが多い。もちろん、すべてのデータについて、あらゆることを知る事は誰にもできない。(p.42)
ビジネスデータスチュワートが行うべき最も重要なことの1つは、キービジネスデータエレメントを定め、各ビジネスデータエレメントについて全社で受け入れられる定義を作成することである。同様に計算されるデータエレメントについて重要な事は、ビジネスデータエレメントが常に同じ方法で導出されるように、導出ルールを標準化することである。ご想像の通り、標準化された同質ルールがあれば、同じビジネスデータエレメントを使用する様々なレポートを調整するための多大な混乱や労力が軽減される。最後に、データについての品質、作成、使用のルールを定義し、さらにはビジネスデータエレメントのお移り的な素材を特定して記録しなければならない。(pp.104-105)

この本は、非常に参考になる内容が多く記載されています。データスチュワードの重要性を認識している方には、手元に置いておくべきリファレンスだと思います。高額ではありますが、購入をお勧めします。

データスチュワードはビジネスをしっかり理解しておく必要があります。トップがその重要性に気付き、このような部門を設置することに理解を深めることが理想です。しかし、現状ではIT部門のメンバーでさえ、その意識が薄い人が多いように感じられます。この点については、開発側にも根付かせる必要があります。また、こうした活動を牽引するデータスチュワードの育成も非常に重要です。AI-ReadyのDWHを意識している方は、その実践が非常に難しいと感じているかもしれませんが、やはり非常に重要です。

 

 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください