階層クラスタリングとは、データ同士の似ている度合いをもとに、グループのまとまりを階層構造として作るクラスタリング手法です。近いデータから順に結合していく方法(凝集型)や、大きな集団を分割していく方法(分割型)で階層を構成します。
階層クラスタリングの特徴は、クラスタ数を最初に決めなくても、まとまり方の全体像を確認しながら分類できる点です。結果はデンドログラム(樹形図)で表現でき、どの高さで枝を切るかによってクラスタ数を調整できます。たとえば顧客の購買傾向を階層で整理し、「大分類→中分類→小分類」のように施策単位を分ける設計が可能です。
運用では、距離の定義(ユークリッド距離など)と、結合方法(単連結・完全連結・平均連結など)の選び方が結果に強く影響する点が重要です。データ数が増えると計算負荷が上がりやすいため、大規模データではサンプリングや別手法との使い分けも検討対象になるでしょう。

