編著:David Plotkin
監訳:Metafindコンサルティング株式会社
データスチュワードシップは、データを信頼できる、高品質なものにし続ける取り組みです。ビッグデータそしてAI(人工知能)の時代になり、あらゆる組織にデータスチュワードシップが求められています。
『データマネジメント知識体系ガイド第二版(DMBOKガイド)』は第3章で担い手であるデータスチュワードの重要性を指摘しています。そこに発言を引用されているDavid Plotkin氏はこのテーマの第一人者であり、著書“Data Stewardship”はロングセラーになっています。 本書は“Data Stewardship”の第二版の邦訳であり、日本で初のデータスチュワードシップ書籍になります。データスチュワードシップの導入と運用に関する明確かつ簡潔、そして実践的なアドバイスとガイドラインを提供します。ガイドラインを見れば組織の構造、ビジネス機能、データ所有権に基づき、どう進めていけばよいかが分かります。Plotkin氏が様々な企業の現場で実践してきたノウハウが多くの成果物の例とともに紹介されています。 第二版で次の点が強化されました。 ●グローバルビジネス:国際企業向けの体制をより詳しく解説。国の違いを考慮したビジネス用語の構成など。 <目次> 1章 データスチュワードシップとデータガバナンス |
スチュワードとは「執事」という意味。冒頭に翻訳者序文があるのですが、これは読まなきゃとモチベーションを掻き立てられる内容です。
データスチュワードシップとは、データオーナー本人に代わって、資産であるデータとして何があるのかを把握し、データを効率よく利用できる状態とし、そのための環境を整え、その状態と環境を長期に維持する活動を指す。
世界的に見ると、データのマネージメントとスチュワードシップが明確に使い分けられ、それぞれの活動が浸透している。一方、日本では、これまでデータスチュワートシップへの関心は低く、本来なら、複数のデータスチュワードが分担すべき役割を、データ関連職が兼任することが多い。IT寄りのデータアーキテクトやデータエンジニアが、特定の業務領域のデータスチュワードの役割を兼ねることも、多くの企業で見られる。 しかし、ビック出た時代を経て、AIの時代に入った今、組織が扱うデータの量は膨大になり、さらに種類と質はあまりにも多様である。データ活用にはビジネスへの直接的な貢献が求められ、ビジネス知識と高いデータ品質が要求されている。こうした状況下で、データの環境整備をデータアーキテクトなどが原因で対応するのは、負荷が大きすぎる。負荷を軽減するための様々なツールやアプリケーションも開発され、導入が進んでいるが、日本ではそうした道具を使いこなす知識と、その知識を持つデータスチュワートが全く取れていない。 日本でもデータカタログの導入が盛んになり、メタデータマネージメントが注目を浴びている。ただ、IT主導でツールの導入が優先され、導入したものの、どんなメタデータをどうやって誰が管理するのか決められず、結果としてツールの利用も定着しない現実がある。(pp.4-5) |
下記の問題提起は納得させられる企業に存在するよくある問題で、根が深く分かっていても改善できないところな気がします。
問題提起
データを扱う際には以下のような多くの課題に直面せざるを得ない。
これらすべての要因により、データの理解が不十分となり、品質が悪いと言う認識が生まれ、そうした違いを理解する能力も乏しくなる、データの誤ったマネージメントにもつながり、プライバシー保護や消費者の権利に関する厳格なルールを定めた、新しい法規制に抵触するようなことになる。(p.15) |
データガバナンス、データスチュワードシップ、データマネージメントの関係性については下記のように定義しています。
データガバナンスの取り組みの一環として、企業全体で正式にデータスチュワードシップを実施する事はデータマネージメントを実施し、これらの課題を解決する上で極めて重要である。データスチュワードシップによって、組織はデータを資産として扱えるようになる。他の資産と同様に、データを目録を作成し、所有し、賢く使用し、マネージメントし理解しなければならない。(p.16) |
Geminiに聞いてみたのですが、分かりやすい回答をしてくれました。
データガバナンスが、データに関する大枠のルールを定める「憲法」のようなものだとすると、データマネジメントは、その憲法に基づいた「法律」に相当し、データスチュワードシップは、法律を執行する「警察官」のような役割です。
データガバナンスが、企業全体のデータに関する戦略的な方向性を示し、データマネジメントが、その戦略を実行するための具体的な活動を行い、データスチュワードシップが、データの品質や利用状況を管理することで、データガバナンスの実現をサポートします。
データオーナーシップを確立するには、そのデータの収集方法と利用者を把握し、そのデータエレメントの内容と品質に最も責任を負うのは誰かを決定する。最後に、データを確実に使用するためには、そのデータがどう作成されたのか、何のために作成されたのか、今後起こりうる新たな状況、さらに現在そのデータが使用されている状況でも、使用するのに適しているかどうか、といったことを把握し、マネジメントする必要がある。(p.16) |
ビジネスデータスチュワードは通常、データをよく知り、データと密接に関わっている人である。「データアナリスト」や「ビジネスアナリスト」といった肩書を持つ人がビジネスデータスチュワードに適していることが多い。もちろん、すべてのデータについて、あらゆることを知る事は誰にもできない。(p.42) |
ビジネスデータスチュワートが行うべき最も重要なことの1つは、キービジネスデータエレメントを定め、各ビジネスデータエレメントについて全社で受け入れられる定義を作成することである。同様に計算されるデータエレメントについて重要な事は、ビジネスデータエレメントが常に同じ方法で導出されるように、導出ルールを標準化することである。ご想像の通り、標準化された同質ルールがあれば、同じビジネスデータエレメントを使用する様々なレポートを調整するための多大な混乱や労力が軽減される。最後に、データについての品質、作成、使用のルールを定義し、さらにはビジネスデータエレメントのお移り的な素材を特定して記録しなければならない。(pp.104-105) |
この本は、非常に参考になる内容が多く記載されています。データスチュワードの重要性を認識している方には、手元に置いておくべきリファレンスだと思います。高額ではありますが、購入をお勧めします。
データスチュワードはビジネスをしっかり理解しておく必要があります。トップがその重要性に気付き、このような部門を設置することに理解を深めることが理想です。しかし、現状ではIT部門のメンバーでさえ、その意識が薄い人が多いように感じられます。この点については、開発側にも根付かせる必要があります。また、こうした活動を牽引するデータスチュワードの育成も非常に重要です。AI-ReadyのDWHを意識している方は、その実践が非常に難しいと感じているかもしれませんが、やはり非常に重要です。