データガバナンスとは、データの利活用に必要なデータそのものを安定的に獲得するための活動(データマネジメント)が、正しく行われるように監督するアクションです。
しかしながら、データガバナンスを、具体的なアクションとして実践できている企業は、決して多くありません。
データガバナンスには高度な専門知識が必要です。そのため、データガバナンスを検討されているほとんどの企業の担当者が、データガバナンスを含むデータマネジメントの世界的な教科書であるDMBOKを一度は確認されていることと思います。しかし実際には以下の2つの理由から、DMBOKをデータガバナンスの実践に活かすことは難しいと感じられることも多いです。
- 高い抽象度:DMBOKは、あらゆる業界やシステムに適用できるようにアクションの内容が抽象化されているため、専門的な知識や経験がなければ具体的なアクションに変換できない(具体的なツールやアウトプットのイメージを提供してくれない)。
- 膨大な分量:DMBOK(日本語訳第2版)は、672ページという膨大な分量があるため、その大量の情報から自社に有効なアクションに繋がる情報を見つけられない。
私はこれまで、データマネジメント・データガバナンスのプロジェクトに数多くこなしてきました。
そこでこの記事では、データガバナンスを実践されたい全ての方に対して、データガバナンスの具体イメージ、実践のためのフレームワーク、実践例、の3点を紹介します。最後までお読みいただくと、データガバナンスの実践可能な具体的なアクションを描くことができると思います。
参考:『データマネジメント知識体系ガイド(DMBOK)とは何か?』
また、データ分析そのものについては以下の記事をご参照ください。
目次
- 1.データガバナンスとは?
- 2.データガバナンスプロジェクトの第一歩は関係者を巻き込みながらの目標設定
- 3.フレームワークから考えるデータガバナンスの実践例10選
- 3-1.参照データとマスターデータ:マスタデータ管理を最初に行う
- 3-2.データウェアハウジングとビジネスインテリジェンス:集計ルールを定め、BIシステムを積極的に使わせる
- 3-3.メタデータ:誰が見てもデータの仕様がわかるようにする
- 3-4.データ品質:データ品質を正しく定義する
- 3-5.データストレージとオペレーション:データ品質をシステム変更から守る
- 3-6.データモデリングとデザイン:データの検索性を担保する
- 3-7.データ統合と相互運用性:データの可用性・完全性・性能をレポートさせる
- 3-8. データセキュリティ:セキュリティは専門家に任せる
- 3-9.ドキュメントとコンテンツ管理:個人情報がどこに保存されているか台帳で管理する
- 3-10.データアーキテクチャ:統合的なデータ分析基盤の構築を行う
- 4.データガバナンスの実践に役立つフレームワーク3選
- まとめ
1.データガバナンスとは?
実態の掴みづらいデータガバナンスを学んでいくにあたり、まずは直感的なイメージを掴みましょう。
1-1.データガバナンスは、データ利活用の推進にあたり守るべきルールをつくり、守らせること
データガバナンスは、あなたの組織で、データ利活用を推進するにあたって守るべきルールを設定します。そのルールを守らせるための様々なアクション、その活動の全体を指します。
そのアクションが多岐に渡るため、単純なアウトプットイメージやツールにイメージを置き換えられず、それ故に具体的にデータガバナンスが何をすればよいのか理解することは難しいです。
それでも、あえて単純なイメージとしてデータガバナンスを表現するなら、データガバナンスはデータ利活用の”風紀委員”です。データガバナンスは、データ利活用の全ての行為を監督する風紀委員の活動、とイメージしてください。
1-2.データガバナンスの役割はデータマネジメントを統制すること
データガバナンスとデータマネジメントはしばしば概念として混同されます。データガバナンスはデータマネジメントの一部であり、データマネジメントの全領域に対してルールを定め、統制しながらデータ利活用がスムーズに進むようにします。
データガバナンスがないデータ利活用プロジェクトでは、データの扱いが個人の良識に委ねられてしまい、個人情報流出やデータの信頼性の破壊など最悪の結果を招いてしまいます。
そうした結果を防ぐために、データガバナンスには以下の原則が2000年代初頭から存在しています。
- リーダーシップと戦略:データガバナンスを成功させるためにはリーダーが明確なビジョンを持つ必要がある
- 業務主導:データガバナンスは業務プロジェクトの一環である
- 責任の共有:全てのデータマネジメント領域において監督側と実行側が共同で責任を負う
- 多階層:データガバナンスは全社レベルと現場レベルの両方で行われる
- フレームワーク立脚:データガバナンスはフレームワークを確立するべきである
- 原則立脚:データガバナンスの核となる原則を定めるべきである
これらに則って自社に必要なルールを定め、データ利活用プロジェクトを進めていくことで大きなトラブルを避けることができます。
参考:総務省『令和四年版情報通信白書データガバナンスへの対応の現状』
1-3.データガバナンスの必要性とメリット
データガバナンスは、アウトプットとして多くのドキュメンテーションが作り上げられます。そのため、「こんなことをしても、文書が積み上がるだけで実効性はないのでは?」という疑問を持たれる方も多いです。しかし、文書がない=決まり・ルールが決まっていない、明文化されていないことから起こる問題は、以下2つの観点で業務に影響を与えるものです。
データガバナンスでデータのサイロ化を防ぐ
大きなトラブルの一例がデータのサイロ化です。システムが部署ごとに分断されてしまって、異なるシステム間でデータが連携できない状態のことを指します。
DXの推進において部署間の持つ知見、データを用いたコラボレーションは非常に重要です。データのサイロ化が起きている場合、例えば顧客や商品を識別するコードは、各部署が独自に定義しています。そのような独自に定義されたデータは、連携して利活用することができません。これは、データ活用において大きな障害となってしまいます。
分析すると非常に価値のあることがあるのに、「欲しいデータが探せない」「データの信用性がない」という状態ですと、データを貯めていても価値化できません。
セキュリティ・コンプライアンスのリスクを低減する
セキュリティ、コンプライアンスのリスクは事業継続に係る大きなインパクトがあります。こういった問題は、起きていないうちにはなかなか注意が向かないことが多いものです。しかし、起きないように先んじて整備しなければならないこと、事前に防げることは多いです。
データの一貫性でさらに質の良いデータ分析・可視化へ
一現在のデータ活用や分析をさらに発展的にしたい、という思いを実現するためにも、データガバナンスは重要です。分析したいデータがどこにあるのか、いつ・どのように・誰が更新したか、などに統制して初めて、データの一貫性が保たれ、品質の良いデータ分析・可視化が組織に浸透します。
参考:『データガバナンス機能』国立情報学研究所オープンサイエンス基盤研究センター
1-4.データガバナンスとGDPRの関係性
データガバナンスとGDPR(EU一般データ保護規則)は密接に関連しています。
GDPRは、EUの個人情報保護に関する規制であり、企業が個人情報を処理する場合には、GDPRに準拠する必要があります。GDPRは、企業が個人情報を収集、使用、共有する方法に関する規則を設けています。
企業は、個人情報を収集する前に、その目的を明確にし、データの収集や処理方法を適切に文書化し、個人情報の取り扱いに関する法的要件を遵守するために適切な手順を講じる必要があります。これには、適切なデータガバナンスフレームワークの導入が含まれます。データガバナンスに適切なフレームワークを導入することで、企業はGDPRに準拠し、個人情報保護に関する法的要件を遵守することができます。
データガバナンスとGDPRの関係性は、特に以下のような点で示されます。
合規性の確保
GDPRは個人データの保護に関する要件を明確に定めています。データガバナンスは、組織がGDPRの要件を遵守し、個人データの適切な管理と保護を実現するための枠組みを提供します。
データのトレーサビリティ
GDPRでは、個人データの処理履歴やデータフローのトレーサビリティが求められます。データガバナンスは、組織がデータの流れや処理手順を明確に把握し、必要な場合にトレーサビリティを実現するための手法を提供します。
データ主体の権利保護
GDPRでは、個人データ主体の権利保護が重視されています。データガバナンスは、組織が個人データ主体の権利を尊重し、個人データの適切な管理と処理を行うための規則とプロセスを提供します。
1-5. データガバナンスとデータマネジメントの違い
データガバナンスは組織内でデータの管理とコントロールを行うための枠組みであるのに対して、データマネジメントはデータ全体のライフサイクルを管理する活動の総称です。
それゆえ、データガバナンスとマネジメントが対象とする範囲はとても似ていますが、データガバナンスは枠組み、データマネジメントは活動・行動であるという違いがあります。
1-6. データガバナンスとマスターデータ管理の違い
マスターデータ管理は先ほど紹介したデータマネジメントの一領域で、データの一貫性や信頼性を確保するためにマスターデータ(顧客マスタ等)を一元的に管理するためのプロセス・技術を指します。
1-7. データガバナンスとデータスチュワードシップの違い
データスチュワードシップは、データの管理と品質向上を実施し、企業のデータ資産がアクセス可能で使用できる状態にする役割やプロセス、責任を指します。
それゆえ、データスチュワードシップはデータガバナンスと比較するとよりカバーする範囲が限定的な用語であると言えます。
データマネジメントを推進するデータビズラボの研修資料をダウンロードする
2.データガバナンスプロジェクトの第一歩は関係者を巻き込みながらの目標設定
データガバナンスプロジェクトはやることが多いですが、第一歩は関係者の巻き込み目標設定をするということが何よりも重要なステップです。具体的なステップやアクションを以下に紹介します。
Step1 プロジェクトの目的の言語化
データガバナンスのプロジェクトが達成しようとする目的と、それによって得られる利益を明確に定義します。例えば、データ品質の向上、リスクの軽減、戦略的な意思決定の強化などが目的となることがあります。
参考:『データ品質とは?品質評価項目や品質を向上させるための実務的対策を解説』
Step2 ステークホルダー(関係者)の期待と要件の言語化
プロジェクトに関与するステークホルダーの期待や要件を収集し、それをプロジェクトの目標とビジョンに反映させます。
Step3 成果物と成果の定義
プロジェクトにおける成果物と、それによって実現される成果を具体的に定義します。例えば、以下のようなものです。
- データガバナンスポリシーの策定
- データ品質評価の導入
- 組織内のデータカタログの構築
3.フレームワークから考えるデータガバナンスの実践例10選
先ほどご紹介したデータガバナンスの原則から、DMBOKのフレームワークを使って実際に取るべきアクションについて考えてみましょう。2章で述べた「第一歩」から進んだ際の、各知識領域の具体的な運用例です。
DMBOKホイールには10個の知識領域が存在しています。
- 参照データとマスターデータ
- データウェアハウジングとビジネスインテリジェンス
- メタデータ
- データ品質
- データストレージとオペレーション
- データモデリングとデザイン
- データ統合と相互運用性
- データセキュリティ
- ドキュメントとコンテンツ管理
- データアーキテクチャ
これらの項目1つ1つごとに、具体的なアクションの実践例を紹介します。
3-1.参照データとマスターデータ:マスタデータ管理を最初に行う
マスタデータ管理は、英語の頭文字をとったMDMと呼ばれ、データガバナンスの最重要要素のひとつです。
例えば、どのような商品を取り扱っているかを記録しておくマスタデータは、商品マスタと呼ばれます。商品マスタは、データ利活用のサービスから、高い頻度で利用されます。この商品マスタが、誰に何の断りもなく消されたり変更されたりしてしまうと、商品データを使用しているデータ利活用のサービスが全てエラーで止まってしまいます。
データ利活用のサービスを開始するなら、依存するマスタデータを洗い出し、勝手な変更が行われないように社内の関連部署に働きかけてください。また、変更が発生する場合には、できるだけ事前に変更の発生を検知して、データ利活用のサービス側で変更に対応できるように指示を出しましょう。
3-2.データウェアハウジングとビジネスインテリジェンス:集計ルールを定め、BIシステムを積極的に使わせる
売上や来店人数など、重要なKGI、KPIは、集計ミスが起きると重要な経営判断を誤ってしまうリスクがあります。そのため、BIシステムを使ってモニタリングする、というルールを設定することが必要です。
分析者がSQLなどのプログラムを都度コーディングして、KGI、KPIをモニタリングしている現場をたまに見かけますが、どんな高いスキルをもった分析者でも人間である以上必ずミスをします。複数人で丁寧にレビューした集計プログラムをBIシステムに登録すれば、品質の高いKGI、KPIのモニタリングが実現できます。例えば、取締役会の議論に用いる分析レポートは、必ずBIシステムから参照するルールを設定するのも、有効なデータガバナンスといえます。
3-3.メタデータ:誰が見てもデータの仕様がわかるようにする
メタデータとは、データの仕様などデータそのものの情報のことを表します。メタデータを検索して、参照可能なシステムは、データ利活用を推進するための必須のものと考えてよいでしょう。
データ利活用を推進し始めると、必ずといっていいほど、社内システムのデータの仕様がよくわからない、という大量の問い合わせが発生します。
問い合わせに回答するのは、社内システムの保守担当などの有識者になります。往々にして、社内システムの担当の人数は限られており、問い合わせの回答に長いリードタイムがかかってしまいます。そのような問い合わせを効率化したり、セルフで行えるようにするのが、メタデータの管理システムです。
注意が必要なのは、どのようなメタデータを整備することが必要なのかを決めるのは、誰が、どのようなデータ利活用をするか、といったユースケース次第であることです。ユースケースが曖昧である場合は、とりあえず機械的に収集しやすいデータ型やカテゴリ値のパターン、連続値の統計量が整備されることが多いです。
このようなメタデータは一定の有用性こそあるものの、期待した業務効率化を達成するのは難しいです。いま、誰が、どのようなメタデータを、どのくらいの時間をかけて調べているのかを確認した上で、効率化のターゲットとするユースケースを設定し、メタデータの整備に取り組んでください。
3-4.データ品質:データ品質を正しく定義する
データ品質として要求することは5W1Hで定義し、むやみにデータ品質管理ツールを導入しないようにしましょう。
データ品質管理ツールは、各データ項目の平均値、最大値、最小値、分散といった、基礎統計量のレポート、簡単な可視化チャートを自動作成する機能が備わっていることが多いです。
ここで注意しなければならないのは、基礎統計量や可視化チャートがどのようになっていれば品質が高いのか定義できているか、ということです。外れ値検知などの少数の例外を除き、ツールを導入しただけで自動的に品質への要求を定義することは不可能です。
データ品質が高い、とは「分析者がデータに求める正確性や適時性、柔軟性といった要件を満たせているかどうか」を指します。よって、そのデータによって実現したい状態を5W1Hの観点から定義することをおすすめします。
例えば、売上(=what)を、日次で(=when)、確認したい要求に対して、月ごとの売上データを収集している場合は、whenの要求に合っていないので、データ品質が低い、と言えます。データに期待する要求を予め定義した上で、必要なツールを導入しましょう。むやみにツールを導入することはデータガバナンスにとって禁物です。
参考:『データ品質とは?品質評価項目や品質を向上させるための実務的対策を解説』
3-5.データストレージとオペレーション:データ品質をシステム変更から守る
データ品質を守るために、社内外のシステム変更の連絡が、予めデータ利活用のシステム担当に入るように、コミュニケーションフローを整備させてください。
データ利活用のシステムは、多くは社内外の様々なシステムからデータを収集する構造、アーキテクチャを保持しています。社内、社外を問わずシステムには日々変更が発生するものです。システムの変更に伴って、収集するデータの内容が変わってしまうと、例えば売上予測の精度が下がってしまったり、売上予測を行う前のデータ処理がエラーになってしまう可能性があります。
社内、社外問わず、システム変更の事前連絡が得られないならば、一時的な利用を除いて、そのシステムからデータを収集するアーキテクチャーを採用すべきではありません。
3-6.データモデリングとデザイン:データの検索性を担保する
データモデリングで悩まずに、データが検索できる状態を目指しましょう。
収集したデータが、どこに保存されているか、どこに移動したか、という「データリネージ」を追いかけられる状態を作ることを優先しましょう。
例えば、プライバシー管理上、問題のあるデータを収集してしまった場合、確実な廃棄を行うためには、データがどこにあるか検索できる必要があります。それが実現できているなら、ひとまず合格点を出してよいと思います。
データモデリングやデザインのガバナンスを行うと、様々な価値が期待できますが、ガバナンスする側に、高いレベルのデータベースの専門知識が必要です。例示したようなリスクヘッジを優先的に取り組むべきです。
3-7.データ統合と相互運用性:データの可用性・完全性・性能をレポートさせる
前日、直近の1週間や1ヶ月で、データにアクセスができたか(可用性)、データの重複など誤りはなかったか(完全性)、データの収集や加工の処理は期日までに終わったか(性能)、定期的にレポートを受け取ってください。
問題があれば改善を指示し、重大な機会損失を最小化させましょう。
3-8. データセキュリティ:セキュリティは専門家に任せる
個人情報の流出への対策を最優先で実行させます。
データ利活用の多くは顧客のデータを活用します。ですので、データ利活用のセキュリティ上の最大リスクのひとつは顧客の個人情報の流出です。
ネットワークの分離、外部からの侵入検知、内部の作業ログの監視、などセキュリティの専門家に対策を立案させましょう。データガバナンスはその幅広さから、担当者が全ての知識領域の専門家になることは不可能です。社内外から専門家を集めることが重要です。
3-9.ドキュメントとコンテンツ管理:個人情報がどこに保存されているか台帳で管理する
ドキュメントを作成し、最新状態に維持するには大きなコストがかかります。だからこそ、データガバナンスとして厳しく管理するドキュメントは、最小限にしたいものです。そして、繰り返しになりますが、データ利活用の最大リスクのひとつは個人情報の流出です。どのような個人情報を保存しているのか、技術者でなくても把握できるようにドキュメントとして管理しましょう。
3-10.データアーキテクチャ:統合的なデータ分析基盤の構築を行う
データ利活用のために収集したデータの統合先(サーバー、ストレージ等)を1箇所に限定しましょう。無秩序に、様々なサーバーやストレージにデータを収集してしまうと、データ利活用に必要なコストは大きくなり、問題が起きたときの調査は難しくなります。
また、全社的なデータ分析基盤を作ることでデータのサイロ化や部署ごとのデータの分断を防ぐことができ、組織的にデータの活用を進められます。結果的にデータの保存にかかるコストも抑えられ、どこにどんなデータが保存されているかいつでも調べることができるように(検索性を担保できている状態)なります。
具体的には以下のデータアーキテクチャが想定されます。
データ分析基盤について詳しくはこちらの記事をご参照ください。
4.データガバナンスの実践に役立つフレームワーク3選
DMBOKを始め、世界のデータガバナンスの教科書が提供しているフレームワークを紹介します。データガバナンスの活動は多岐に渡ります。データガバナンスの原則の1つであるフレームワーク立脚の観点からも、自己流で取り組むよりフレームワークの示す道筋に沿って推進することが大切です。
4-1.DMBOKホイール(Data Management Association International)
DMBOKホイールは、非営利団体DAMA InternationalがDMBOKで定義する11個の知識領域です。
知識領域の中心には、データガバナンスが存在し、その他10個の知識領域の活動を実行管理する、という構造を持っています。DMBOKホイールの良いところは、データガバナンスに取り組む観点として知識領域が網羅的に用意されていることです。更に、その知識体系は、日本語で詳細に解説されています。一方、その解説の記述の抽象度が高いため、具体的なアクションに繋げるには、データガバナンスを始め様々な専門知識が求められます。
引用:DAMA Japan
参考:DAMA Japan Chapter データマネジメント協会支部
4-2.データガバナンス成熟度モデル(Gartner)
データガバナンス成熟度モデルは、世界的なシンクタンクであるガートナー社が定義しているデータガバナンスのフェーズの考え方、およびフェーズでとるべきアクションです。良いところは、自社のフェーズにて取り組むべき具体的なアクションが、網羅的に示されているところです。一方、DMBOKホイールと同じく、記述の抽象度は高いので、そのまま取り組めるマニュアルではありません。あくまで、実践のための指針として利用するものです。
引用:Gartner data governance maturity model
4-3.データマネジメント成熟度モデル(CMMI Institute)
ソフトウェアの開発プロセスの成熟度モデルで有名なCMMIですが、データマネジメント版が発行されています。CMMIは、米国の国防総省の出資によって、カーネギーメロン大学が開発したプロセス改善モデルです。
何ができていれば、データガバナンスの成熟度が高いと評価できるのか、明確な指針を提供してくれます。内容は、他の2つと同じく専門知識を要しますが、他の2つと違って具体的な記述も多いので、そのまま取り入れられるアクションを見つけやすいです。
まとめ
この記事では、データガバナンスの本質は「データ利活用におけるリスクヘッジと価値創出の2つのバランスを戦略的にコントロールすることである」ということをご紹介してきました。1つ1つの実践例を参考に今何をするべきかおわかりいただけたかと思います。
データガバナンスはこれからデータ利活用を始められる方が、データ利活用の検討開始時点から意識して練り上げるべきものですが、その立ち上げには、様々な背景知識や、深い経験が必要とされます。
当社では、データ利活用の推進コンサルティング、データプラットフォームの構築を多く手掛けており、豊富な経験を持ったコンサルタントがお客様のデータガバナンス体制の立ち上げをサポートいたします。
データ活用や、データガバナンス体制立ち上げをご検討されている場合は、ぜひ一度データビズラボへお問い合わせください。
コメント