説明変数とは、分析で「結果に影響している可能性がある要因」として扱う変数です。回帰分析では、説明変数の値から目的変数(従属変数)を説明したり予測したりします。独立変数と呼ばれる場合もありますが、因果関係が確定していない段階でも説明変数という言い方は使われます。
たとえば「売上が何で決まるか」を考えるなら、広告費、訪問数、平均単価などが説明変数です。SaaSの解約予測では、ログイン回数、機能利用数、サポート問い合わせ回数のような行動指標を説明変数に置き、解約の有無や解約率を目的変数にします。
説明変数を選ぶときは、定義の曖昧さや欠損、他の変数との相関を確認し、モデルに入れる理由を明確にすることが重要です。説明変数が多すぎると過学習や解釈の難しさにつながり、逆に重要な要因が抜けるとモデルの精度や示唆が弱くなります。目的に応じて、ドメイン知識と検証を往復しながら選定すると実務で使える分析になりやすいです。

