データとは、観測や記録によって得られた事実や数値、状態を表す情報のことです。企業活動では、売上や在庫のような業務データ、Webの行動ログ、センサー値、問い合わせ履歴などがデータに当たります。データは「集めれば価値が出る」ものではなく、目的に合わせて整理し、解釈できる形にすることで初めて意思決定に使える情報になります。
データを扱うときは、形式と粒度を揃えることが重要です。構造化データは集計しやすい一方、文章や画像のような非構造データは、そのままでは分析しにくいため前処理が必要になります。さらに、同じ「顧客」でもシステムごとにIDや定義が違うと統合できないため、データ定義の統一や名寄せの設計が欠かせません。
実務では、データの品質、鮮度、アクセス権限、監査ログ、保存期間まで含めた運用設計が成果を左右します。誤りや欠損が多いデータを使うと、分析結果が正しくても意思決定を誤らせることがあります。データを資産として扱うなら、収集→保管→加工→提供→利用の流れを可視化し、責任者とルールを定めることが土台です。

