
データガバナンスとは、データの利活用に必要なデータそのものを安定的に獲得するための活動(データマネジメント)が、正しく行われるように監督するアクションです。
しかしながら、データガバナンスを、具体的なアクションとして実践できている企業は、決して多くありません。
データガバナンスには高度な専門知識が必要です。そのため、データガバナンスを検討されているほとんどの企業の担当者が、データガバナンスを含むデータマネジメントの世界的な教科書であるDMBOKを一度は確認されていることと思います。しかし実際には以下の2つの理由から、DMBOKをデータガバナンスの実践に活かすことは難しいです。
- 高い抽象度:DMBOKは、あらゆる業界やシステムに適用できるようにアクションの内容が抽象化されているため、専門的な知識や経験がなければ具体的なアクションに変換できない(具体的なツールやアウトプットのイメージを提供してくれない)。
- 膨大な分量:DMBOK(日本語訳第2版)は、672ページという膨大な分量があるため、その大量の情報から自社に有効なアクションに繋がる情報を見つけられない。
そこでこの記事では、データガバナンスを実践されたい全ての方に対して、データガバナンスの具体イメージ、実践のためのフレームワーク、実践例、の3点を紹介します。最後までお読みいただくと、データガバナンスの実践可能な具体的なアクションを描くことができると思います。
目次
- 1.データガバナンスとは?
- 2.フレームワークから考えるデータガバナンスの実践例10選
- 2-1.参照データとマスターデータ:マスタデータ管理を最初に行う
- 2-2.データウェアハウジングとビジネスインテリジェンス:集計ルールを定め、BIシステムを積極的に使わせる
- 2-3.メタデータ:誰が見てもデータの仕様がわかるようにする
- 2-4.データ品質:データ品質を正しく定義する
- 2-5.データストレージとオペレーション:データ品質をシステム変更から守る
- 2-6.データモデリングとデザイン:データの検索性を担保する
- 2-7.データ統合と相互運用性:データの可用性・完全性・性能をレポートさせる
- 2-8. データセキュリティ:セキュリティは専門家に任せる
- 2-9.ドキュメントとコンテンツ管理:個人情報がどこに保存されているか台帳で管理する
- 2-10.データアーキテクチャ:統合的なデータ分析基盤の構築を行う
- 3.データガバナンスの実践に役立つフレームワーク3選
- 4.まとめ
1.データガバナンスとは?
実態の掴みづらいデータガバナンスを学んでいくにあたり、まずは直感的なイメージを掴みましょう。
1-1.データガバナンスは、データ利活用の推進にあたり守るべきルールをつくり、守らせること
データガバナンスは、あなたの組織で、データ利活用を推進するにあたって守るべきルールを設定します。そのルールを守らせるための様々なアクション、その活動の全体を指します。
そのアクションが多岐に渡るため、単純なアウトプットイメージやツールにイメージを置き換えられず、それ故に具体的にデータガバナンスが何をすればよいのか理解することは難しいです。
それでも、あえて単純なイメージとしてデータガバナンスを表現するなら、データガバナンスはデータ利活用の”風紀委員”です。データガバナンスは、データ利活用の全ての行為を監督する風紀委員の活動、とイメージしてください。
1-2.データガバナンスによってデータマネジメントを統制する
データガバナンスとデータマネジメントはしばしば概念として混同されます。データガバナンスはデータマネジメントの一部であり、データマネジメントの全領域に対してルールを定め、統制しながらデータ利活用がスムーズに進むようにします。
データガバナンスがないデータ利活用プロジェクトでは、データの扱いが個人の良識に委ねられてしまい、個人情報流出やデータの信頼性の破壊など最悪の結果を招いてしまいます。
そうした結果を防ぐために、データガバナンスには以下の原則が2000年代初頭から存在しています。
- リーダーシップと戦略:データガバナンスを成功させるためにはリーダーが明確なビジョンを持つ必要がある
- 業務主導:データガバナンスは業務プロジェクトの一環である
- 責任の共有:全てのデータマネジメント領域において監督側と実行側が共同で責任を負う
- 多階層:データガバナンスは全社レベルと現場レベルの両方で行われる
- フレームワーク立脚:データガバナンスはフレームワークを確立するべきである
- 原則立脚:データガバナンスの核となる原則を定めるべきである
これらに則って自社に必要なルールを定め、データ利活用プロジェクトを進めていくことで大きなトラブルを避けることができます。
データガバナンスでデータのサイロ化を防ぐ
大きなトラブルの一例がデータのサイロ化です。システムが部署ごとに分断されてしまって、異なるシステム間でデータが連携できない状態のことを指します。
DXの推進において部署間の持つ知見、データを用いたコラボレーションは非常に重要です。データのサイロ化が起きている場合、例えば顧客や商品を識別するコードは、各部署が独自に定義しています。そのような独自に定義されたデータは、連携して利活用することができません。これは、DX推進において大きな障害となってしまいます。
データガバナンスは、システムや部署が異なっても、データ利活用を見据えて、一定のルールに従ってデータを生成、蓄積させるように、社内のシステム開発を統制します。そのような統制は、DX推進には必須の取り組みになります。
2.フレームワークから考えるデータガバナンスの実践例10選
先ほどご紹介したデータガバナンスの原則から、DMBOKのフレームワークを使って実際に取るべきアクションについて考えてみましょう。
DMBOKホイールには10個の知識領域が存在しています。
- 参照データとマスターデータ
- データウェアハウジングとビジネスインテリジェンス
- メタデータ
- データ品質
- データストレージとオペレーション
- データモデリングとデザイン
- データ統合と相互運用性
- データセキュリティ
- ドキュメントとコンテンツ管理
- データアーキテクチャ
これらの項目1つ1つごとに、具体的なアクションの実践例を紹介します。
2-1.参照データとマスターデータ:マスタデータ管理を最初に行う
マスタデータ管理は、英語の頭文字をとったMDMと呼ばれ、データガバナンスの最重要要素のひとつです。
例えば、どのような商品を取り扱っているかを記録しておくマスタデータは、商品マスタと呼ばれます。商品マスタは、データ利活用のサービスから、高い頻度で利用されます。この商品マスタが、誰に何の断りもなく消されたり変更されたりしてしまうと、商品データを使用しているデータ利活用のサービスが全てエラーで止まってしまいます。
データ利活用のサービスを開始するなら、依存するマスタデータを洗い出し、勝手な変更が行われないように社内の関連部署に働きかけてください。また、変更が発生する場合には、できるだけ事前に変更の発生を検知して、データ利活用のサービス側で変更に対応できるように指示を出しましょう。
2-2.データウェアハウジングとビジネスインテリジェンス:集計ルールを定め、BIシステムを積極的に使わせる
売上や来店人数など、重要なKGI、KPIは、集計ミスが起きると重要な経営判断を誤ってしまうリスクがあります。そのため、BIシステムを使ってモニタリングする、というルールを設定することが必要です。
分析者がSQLなどのプログラムを都度コーディングして、KGI、KPIをモニタリングしている現場をたまに見かけますが、どんな高いスキルをもった分析者でも人間である以上必ずミスをします。複数人で丁寧にレビューした集計プログラムをBIシステムに登録すれば、品質の高いKGI、KPIのモニタリングが実現できます。例えば、取締役会の議論に用いる分析レポートは、必ずBIシステムから参照するルールを設定するのも、有効なデータガバナンスといえます。
2-3.メタデータ:誰が見てもデータの仕様がわかるようにする
メタデータとは、データの仕様などデータそのものの情報のことを表します。メタデータを検索して、参照可能なシステムは、データ利活用を推進するための必須のものと考えてよいでしょう。
データ利活用を推進し始めると、必ずといっていいほど、社内システムのデータの仕様がよくわからない、という大量の問い合わせが発生します。
問い合わせに回答するのは、社内システムの保守担当などの有識者になります。往々にして、社内システムの担当の人数は限られており、問い合わせの回答に長いリードタイムがかかってしまいます。そのような問い合わせを効率化したり、セルフで行えるようにするのが、メタデータの管理システムです。
注意が必要なのは、どのようなメタデータを整備することが必要なのかを決めるのは、誰が、どのようなデータ利活用をするか、といったユースケース次第であることです。ユースケースが曖昧である場合は、とりあえず機械的に収集しやすいデータ型やカテゴリ値のパターン、連続値の統計量が整備されることが多いです。
このようなメタデータは一定の有用性こそあるものの、期待した業務効率化を達成するのは難しいです。いま、誰が、どのようなメタデータを、どのくらいの時間をかけて調べているのかを確認した上で、効率化のターゲットとするユースケースを設定し、メタデータの整備に取り組んでください。
2-4.データ品質:データ品質を正しく定義する
データ品質として要求することは5W1Hで定義し、むやみにデータ品質管理ツールを導入しないようにしましょう。
データ品質管理ツールは、各データ項目の平均値、最大値、最小値、分散といった、基礎統計量のレポート、簡単な可視化チャートを自動作成する機能が備わっていることが多いです。
ここで注意しなければならないのは、基礎統計量や可視化チャートがどのようになっていれば品質が高いのか定義できているか、ということです。外れ値検知などの少数の例外を除き、ツールを導入しただけで自動的に品質への要求を定義することは不可能です。
データ品質が高い、とは「分析者がデータに求める正確性や適時性、柔軟性といった要件を満たせているかどうか」を指します。よって、そのデータによって実現したい状態を5W1Hの観点から定義することをおすすめします。
例えば、売上(=what)を、日次で(=when)、確認したい要求に対して、月ごとの売上データを収集している場合は、whenの要求に合っていないので、データ品質が低い、と言えます。データに期待する要求を予め定義した上で、必要なツールを導入しましょう。むやみにツールを導入することはデータガバナンスにとって禁物です。
2-5.データストレージとオペレーション:データ品質をシステム変更から守る
データ品質を守るために、社内外のシステム変更の連絡が、予めデータ利活用のシステム担当に入るように、コミュニケーションフローを整備させてください。
データ利活用のシステムは、多くは社内外の様々なシステムからデータを収集する構造、アーキテクチャを保持しています。社内、社外を問わずシステムには日々変更が発生するものです。システムの変更に伴って、収集するデータの内容が変わってしまうと、例えば売上予測の精度が下がってしまったり、売上予測を行う前のデータ処理がエラーになってしまう可能性があります。
社内、社外問わず、システム変更の事前連絡が得られないならば、一時的な利用を除いて、そのシステムからデータを収集するアーキテクチャーを採用すべきではありません。
2-6.データモデリングとデザイン:データの検索性を担保する
データモデリングで悩まずに、データが検索できる状態を目指しましょう。
収集したデータが、どこに保存されているか、どこに移動したか、という「データリネージ」を追いかけられる状態を作ることを優先しましょう。
例えば、プライバシー管理上、問題のあるデータを収集してしまった場合、確実な廃棄を行うためには、データがどこにあるか検索できる必要があります。それが実現できているなら、ひとまず合格点を出してよいと思います。
データモデリングやデザインのガバナンスを行うと、様々な価値が期待できますが、ガバナンスする側に、高いレベルのデータベースの専門知識が必要です。例示したようなリスクヘッジを優先的に取り組むべきです。
2-7.データ統合と相互運用性:データの可用性・完全性・性能をレポートさせる
前日、直近の1週間や1ヶ月で、データにアクセスができたか(可用性)、データの重複など誤りはなかったか(完全性)、データの収集や加工の処理は期日までに終わったか(性能)、定期的にレポートを受け取ってください。
問題があれば改善を指示し、重大な機会損失を最小化させましょう。
2-8. データセキュリティ:セキュリティは専門家に任せる
個人情報の流出への対策を最優先で実行させます。
データ利活用の多くは顧客のデータを活用します。ですので、データ利活用のセキュリティ上の最大リスクのひとつは顧客の個人情報の流出です。
ネットワークの分離、外部からの侵入検知、内部の作業ログの監視、などセキュリティの専門家に対策を立案させましょう。データガバナンスはその幅広さから、担当者が全ての知識領域の専門家になることは不可能です。社内外から専門家を集めることが重要です。
2-9.ドキュメントとコンテンツ管理:個人情報がどこに保存されているか台帳で管理する
ドキュメントを作成し、最新状態に維持するには大きなコストがかかります。だからこそ、データガバナンスとして厳しく管理するドキュメントは、最小限にしたいものです。そして、繰り返しになりますが、データ利活用の最大リスクのひとつは個人情報の流出です。どのような個人情報を保存しているのか、技術者でなくても把握できるようにドキュメントとして管理しましょう。
2-10.データアーキテクチャ:統合的なデータ分析基盤の構築を行う
データ利活用のために収集したデータの統合先(サーバー、ストレージ等)を1箇所に限定しましょう。無秩序に、様々なサーバーやストレージにデータを収集してしまうと、データ利活用に必要なコストは大きくなり、問題が起きたときの調査は難しくなります。
また、全社的なデータ分析基盤を作ることでデータのサイロ化や部署ごとのデータの分断を防ぐことができ、組織的にデータの活用を進められます。結果的にデータの保存にかかるコストも抑えられ、どこにどんなデータが保存されているかいつでも調べることができるように(検索性を担保できている状態)なります。
具体的には以下のデータアーキテクチャが想定されます。
データ分析基盤について詳しくはこちらの記事をご参照ください。
3.データガバナンスの実践に役立つフレームワーク3選
DMBOKを始め、世界のデータガバナンスの教科書が提供しているフレームワークを紹介します。データガバナンスの活動は多岐に渡ります。データガバナンスの原則の1つであるフレームワーク立脚の観点からも、自己流で取り組むよりフレームワークの示す道筋に沿って推進することが大切です。
3-1.DMBOKホイール(Data Management Association International)
DMBOKホイールは、非営利団体DAMA InternationalがDMBOKで定義する11個の知識領域です。
知識領域の中心には、データガバナンスが存在し、その他10個の知識領域の活動を実行管理する、という構造を持っています。DMBOKホイールの良いところは、データガバナンスに取り組む観点として知識領域が網羅的に用意されていることです。更に、その知識体系は、日本語で詳細に解説されています。一方、その解説の記述の抽象度が高いため、具体的なアクションに繋げるには、データガバナンスを始め様々な専門知識が求められます。
引用:DAMA Japan
参考:DAMA Japan Chapter データマネジメント協会支部
3-2.データガバナンス成熟度モデル(Gartner)
データガバナンス成熟度モデルは、世界的なシンクタンクであるガートナー社が定義しているデータガバナンスのフェーズの考え方、およびフェーズでとるべきアクションです。良いところは、自社のフェーズにて取り組むべき具体的なアクションが、網羅的に示されているところです。一方、DMBOKホイールと同じく、記述の抽象度は高いので、そのまま取り組めるマニュアルではありません。あくまで、実践のための指針として利用するものです。
引用:Gartner data governance maturity model
3-3.データマネジメント成熟度モデル(CMMI Institute)
ソフトウェアの開発プロセスの成熟度モデルで有名なCMMIですが、データマネジメント版が発行されています。CMMIは、米国の国防総省の出資によって、カーネギーメロン大学が開発したプロセス改善モデルです。
何ができていれば、データガバナンスの成熟度が高いと評価できるのか、明確な指針を提供してくれます。内容は、他の2つと同じく専門知識を要しますが、他の2つと違って具体的な記述も多いので、そのまま取り入れられるアクションを見つけやすいです。
4.まとめ
この記事では、データガバナンスの本質は「データ利活用におけるリスクヘッジと価値創出の2つのバランスを戦略的にコントロールすることである」ということをご紹介してきました。1つ1つの実践例を参考に今何をするべきかおわかりいただけたかと思います。
データガバナンスはこれからデータ利活用を始められる方が、データ利活用の検討開始時点から意識して練り上げるべきものですが、その立ち上げには、様々な背景知識や、深い経験が必要とされます。
当社では、データ利活用の推進コンサルティング、データプラットフォームの構築を多く手掛けており、豊富な経験を持ったコンサルタントがお客様のデータガバナンス体制の立ち上げをサポートいたします。
コメント