
データガバナンスとは、データの利活用に必要なデータそのものを安定的に獲得するための活動(データマネジメント)が、正しく行われるように監督するアクションです。
しかしながら、データガバナンスを、具体的なアクションとして実践できている企業は、決して多くありません。
データガバナンスには高度な専門知識が必要です。そのため、データガバナンスを検討されているほとんどの企業の担当者が、データガバナンスを含むデータマネジメントの世界的な教科書であるDMBOKを一度は確認されていることと思います。しかし、DMBOKを、データガバナンスの実践に活かすには非常に高い2つのハードルがあります。
- 高い抽象度:DMBOKは、あらゆる業界やシステムに適用できるようにアクションの内容が抽象化されているため、専門的な知識や経験がなければ具体的なアクションに変換できない(具体的なツールやアウトプットのイメージを提供してくれない)。
- 膨大な分量:DMBOK(日本語訳第2版)は、672ページという膨大な分量があるため、その大量の情報から自社に有効なアクションに繋がる情報を見つけられない。
そこでこの記事では、データガバナンスを実践されたい全ての方に対して、データガバナンスの具体イメージ、実践のためのフレームワーク、実践例、の3点を紹介します。最後までお読みいただくと、データガバナンスの実践可能な具体的なアクションを描くことができると思います。
目次
- 1.データガバナンスとは?
- 2.データガバナンスの実践に役立つフレームワーク3選
- 3.いますぐ取り組むべきデータガバナンスの実践例10選
- 3-1.重要なKGI、KPIは自由に集計禁止、BIシステムを使わせる
- 3-2.ユースケースが曖昧なメタデータは整備させない
- 3-3.データ品質の要求を5W1Hで定義し、むやみにデータ品質管理ツールを導入させない
- 3-4.データ品質を破壊する社内外のシステム変更をコントロールする
- 3-5.データモデリングには口出しせず、データが検索できることを担保させる
- 3-6.データの可用性・完全性・性能をレポートさせる
- 3-7.個人情報の流出への対策を最優先で実行させる
- 3-8.データ利活用のために収集したデータの統合先(サーバー、ストレージ等)を1箇所に限定する
- 3-9.個人情報がどこに保存されているか台帳で管理する
- 3-10.マスタデータ管理は真っ先に取り組む
- 4.まとめ
1.データガバナンスとは?
実態の掴みづらいデータガバナンスを学んでいくにあたり、まずは直感的なイメージを掴みましょう。
1-1.データガバナンスは、データ利活用の推進にあたり守るべきルールををつくり、守らせること
データガバナンスは、あなたの組織で、データ利活用を推進するにあたって守るべきルールを設定します。そのルールを守らせるための様々なアクション、その活動の全体を指します。
データガバナンスは、そのアクションが多岐に渡るため、単純なアウトプットイメージやツールにイメージを置き換えられず、それ故に理解が非常に難しいものです。
それでも、あえて単純なイメージとしてデータガバナンスを表現するなら、データガバナンスはデータ利活用の”風紀委員”です。データガバナンスは、データ利活用の全ての行為を監督する風紀委員の活動、とイメージしてください。
2.データガバナンスの実践に役立つフレームワーク3選
DMBOKを始め、世界のデータガバナンスの教科書が提供しているフレームワークを紹介します。データガバナンスの活動は多岐に渡ります。自己流で取り組むよりも、フレームワークの示す道筋に沿って推進することが大切です。
2-1.DMBOKホイール(Data Management Association International)
DMBOKホイールは、非営利団体DAMA InternationalがDMBOKで定義する11個の知識領域です。
知識領域の中心には、データガバナンスが存在し、その他10個の知識領域の活動を実行管理する、という構造を持っています。DMBOKホイールの良いところは、データガバナンスに取り組む観点として知識領域が網羅的に用意されていることです。更に、その知識体系は、日本語で詳細に解説されています。一方、その解説の記述の抽象度が高いため、具体的なアクションに繋げるには、データガバナンスを始め様々な専門知識が求められます。
引用:DAMA Japan
参考:DAMA Japan Chapter データマネジメント協会支部
2-2.データガバナンス成熟度モデル(Gartner)
データガバナンス成熟度モデルは、世界的なシンクタンクであるガートナー社が定義しているデータガバナンスのフェーズの考え方、およびフェーズでとるべきアクションです。良いところは、自社のフェーズにて取り組むべき具体的なアクションが、網羅的に示されているところです。一方、DMBOKホイールと同じく、記述の抽象度は高いので、そのまま取り組めるマニュアルではありません。あくまで、実践のための指針として利用するものです。
引用:Gartner data governance maturity model
2-3.データマネジメント成熟度モデル(CMMI Institute)
ソフトウェアの開発プロセスの成熟度モデルで有名なCMMIですが、データマネジメント版が発行されています。CMMIは、米国の国防総省の出資によって、カーネギーメロン大学が開発したプロセス改善モデルです。
何ができていれば、データガバナンスの成熟度が高いと評価できるのか、明確な指針を提供してくれます。内容は、他の2つと同じく専門知識を要しますが、他の2つと違って具体的な記述も多いので、そのまま取り入れられるアクションを見つけやすいです。
3.いますぐ取り組むべきデータガバナンスの実践例10選
ここでは、DMBOKホイールの10個の知識領域ごとに、具体的なアクションの実践例を紹介します。
3-1.重要なKGI、KPIは自由に集計禁止、BIシステムを使わせる
売上や来店人数など、重要なKGI、KPIは、集計ミスが起きると重要な経営判断を誤ってしまうリスクがあります。ですので、BIシステムを使ってモニタリングする、というルールを設定することが必要です。
分析者がSQLなどのプログラムを都度コーディングして、KGI、KPIをモニタリングしている現場をたまに見かけますが、どんな高いスキルをもった分析者でも人間です。人間は必ずミスをします。複数人で丁寧にレビューした集計プログラムをBIシステムに登録すれば、品質の高いKGI、KPIのモニタリングが実現できます。例えば、取締役会の議論に用いる分析レポートは、必ずBIシステムから参照するルールを設定するのも、非常に有効なデータガバナンスといえます。
3-2.ユースケースが曖昧なメタデータは整備させない
データ利活用を推進し始めるとまもなく、データ分析のためにデータそのものを説明した情報(メタデータ)が調べやすいようにメタデータ管理システムを整備してほしい、というニーズが現場から上がってきます。
しかし、分析のために便利だから、という漠然とした要求に基づいてメタデータ管理システムの開発に着手すると、本当に必要なメタデータが定義できず、開発が途中で頓挫してしまいます。
メタデータ管理システムに対する要望が社内で高まってきたとき、データガバナンス担当は、どのような分析に、どのようなメタデータが必要か、ユースケースは明確か、確認を行ってください。
3-3.データ品質の要求を5W1Hで定義し、むやみにデータ品質管理ツールを導入させない
「データ品質を高めるためにデータ品質管理ツールを導入した」という例をよく目にします。
データ品質管理ツールは、各データ項目の平均値、最大値、最小値、分散といった、基礎統計量のレポート、簡単な可視化チャートを自動作成する機能が備わっていることが多いです。
ここで注意しなければならないのは、基礎統計量や可視化チャートどのようになっていれば品質が高いのか、定義できているか、ということです。外れ値検知などの少数の例外を除き、ツールを導入しただけで自動的に品質への要求を定義することは不可能です。
データ品質が高い、とはデータに対する要求に合っているかどうか、を指します。ですので、データに対する要求は、そのデータによって実現する状態を5W1Hとして定義することをおすすめします。
例えば、売上(=what)を、日次で(=when)、確認したい要求に対して、月ごとの売上データを収集している場合は、whenの要求に合っていないので、データ品質が低い、と言えます。データに期待する要求を予め定義した上で、必要なツールを導入しましょう。むやみにツールを導入することはデータガバナンスにとって禁物です。
3-4.データ品質を破壊する社内外のシステム変更をコントロールする
データ品質を守るために、社内外のシステム変更の連絡が、予めデータ利活用のシステム担当に入るように、コミュニケーションフローを整備させてください。
データ利活用のシステムは、多くは社内外の様々なシステムからデータを収集する構造、アーキテクチャーを保持しています。社内、社外を問わずシステムには日々変更が発生するものです。システムの変更に伴って、収集するデータの内容が変わってしまうと、例えば売上予測の精度が下がってしまったり、売上予測を行う前のデータ処理がエラーになってしまう可能性があります。
社内、社外問わず、システム変更の事前連絡が得られないならば、一時的な利用を除いて、そのシステムからデータを収集するアーキテクチャーを採用すべきではありません。
3-5.データモデリングには口出しせず、データが検索できることを担保させる
収集したデータが、どこに保存されているか、どこに移動したか、という「データリネージ」を追いかけられる状態を作ることを優先しましょう。
例えば、プライバシー管理上、問題のあるデータを収集してしまった場合、確実な廃棄を行うためには、データがどこにあるか検索できる必要があります。それが実現できているなら、ひとまず合格点を出してよいと思います。
データモデリングやデザインのガバナンスを行うと、様々な価値が期待できますが、ガバナンスする側に、高いレベルのデータベースの専門知識が必要です。例示したようなリスクヘッジを優先的に取り組むべきです。
3-6.データの可用性・完全性・性能をレポートさせる
前日、直近の1週間や1ヶ月で、データにアクセスができたか(可用性)、データの重複など誤りはなかったか(完全性)、データの収集や加工の処理は期日までに終わったか(性能)、定期的にレポートを受け取ってください。
問題があれば改善を指示し、重大な機会損失を最小化させましょう。
3-7.個人情報の流出への対策を最優先で実行させる
データ利活用の多くは顧客のデータを活用します。
ですので、データ利活用のセキュリティ上の最大リスクのひとつは顧客の個人情報の流出です。
ネットワークの分離、外部からの侵入検知、内部の作業ログの監視、などセキュリティの専門家に対策を立案させましょう。データガバナンスはその幅広さから、担当者が全ての知識領域の専門家になることは不可能です。社内外から専門家を集めることが重要です。
3-8.データ利活用のために収集したデータの統合先(サーバー、ストレージ等)を1箇所に限定する
データの保存にはコストがかかります。また、どこにどんなデータが保存されているか、調べられることは重要です。
無秩序に、様々なサーバーやストレージにデータを収集してしまうと、データ利活用に必要なコストは大きくなり、問題が起きたときの調査は難しくなるでしょう。
3-9.個人情報がどこに保存されているか台帳で管理する
ドキュメントを作成し、最新状態に維持するには大きなコストがかかります。だから、データガバナンスとして厳しく管理するドキュメントは、最小限にしたいものです。そして、繰り返しになりますが、データ利活用の最大リスクのひとつは個人情報の流出です。どのような個人情報を保存しているのか、技術者でなくても把握できるようにドキュメントとして管理しましょう。
3-10.マスタデータ管理は真っ先に取り組む
マスタデータ管理は、英語の頭文字をとったMDMと呼ばれ、データガバナンスの最重要要素のひとつです。MDMを簡単に説明します。
どのような商品を取り扱っているかを記録しておくマスタデータは、商品マスタと呼ばれます。商品マスタは、データ利活用のサービスから、高い頻度で利用されます。この商品マスタが、誰に、何の断りもなく、消されたり、変更されてしまうとどうなるでしょう。データ利活用のサービスは全てエラーで止まってしまうでしょう。
データ利活用のサービスを開始するなら、依存するマスタデータを洗い出して、その変更が行われないように、社内の関連部署に働きかけてください。また、やむなく変更が発生する場合でも、できるだけ事前に変更の発生を検知して、データ利活用のサービス側で変更に対応できるように指示を出してください。
4.まとめ
この記事では、データガバナンスの本質は、データ利活用におけるリスクヘッジと価値創出のバランスの戦略的コントロールであること、そのようなコントロールの実践方法を紹介しました。
データガバナンスは、これからデータ利活用を始められる方が、データ利活用の検討開始時点から意識して、練り上げていくべきものです。
しかし、データガバナンスの立ち上げには、様々な背景知識や、深い経験が必要です。
当社では、データ利活用の推進コンサルティング、データプラットフォームの構築を多く手掛けておりますが、その際には豊富な経験を持ったコンサルタントが、お客様のデータガバナンス体制の立ち上げをサポートしております。
コメント