ユーザー行動データは、ユーザーがサービスやプロダクト上で行った操作や行動を、イベントとして記録したデータです。ページ閲覧、クリック、検索、カート投入、購入、アプリ起動、機能利用、問い合わせ送信などが典型で、行動の時系列と文脈を捉えられます。アンケートの主観情報と違い、実際の行動にもとづいて改善仮説を検証できる点が価値になります。
実務では、イベント定義を先に固め、必要な属性(ユーザーID、セッションID、タイムスタンプ、画面/機能名、流入元、デバイスなど)を揃えることが重要です。ID設計が曖昧だと、ログイン前後の同一人物判定やクロスデバイスの統合が崩れ、ファネル分析やリテンション分析の数値が信用できなくなります。計測タグの重複発火や欠損、時刻のズレも頻発するため、件数の急変や必須項目の欠損率をモニタリングし、仕様変更時に差分を追える状態を作ることが必要です。
活用例としては、ファネル分析で離脱箇所を特定する、コホートで継続率を追う、セグメント別に施策の効果を測る、レコメンドや不正検知の特徴量にする、といった使い方があります。プライバシー面では、個人情報や機微情報の混入を避け、目的と保存期間、同意、オプトアウト、アクセス制御を一貫して設計することが欠かせません。行動データは量が増えやすいので、パーティション設計、圧縮、集計テーブルの用意まで含めて運用すると、コストと性能のバランスが取りやすくなります。

