データアーキテクチャとは、組織がデータを収集、保存、加工し、提供して活用するまでの全体像を、構造とルールとして設計する考え方です。データの流れ(取得元から利用先まで)と、データを置く場所や加工方式、責任分担を一貫した形で整理することを指します。個別のツール選定よりも先に「データをどう扱う組織にするか」を決める設計だと捉えるとわかりやすいでしょう。
データアーキテクチャの設計対象は、データソース、取り込み(ETL/ELT)、保管(データレイクやDWH)、加工、提供(データマートやAPI、BI)まで広く含まれます。加えて、データ定義やメタデータ、品質管理、アクセス権限、監査ログ、データリネージュのような統制面も整備します。データ民主化やSSOTを実現するには、技術と運用をセットで設計する視点が中心です。
たとえば「まず生データを集め、用途別に整形し、指標を共通定義で配る」という流れを、役割分担と運用ルールまで含めて定義します。ログや業務データの取り込み遅延、スキーマ変更、権限変更が起きたときの扱いも先に決めておくようにしましょう。こうした設計がないと、サイロ化や二重管理、数字の不一致が起きやすくなります。事業目的、データの変化頻度、セキュリティ要件を踏まえ、段階的に拡張できる形で設計することが大切です。

