変数変換は、元の変数を別の形に変えることで、分析やモデル化に適した性質へ整える前処理です。たとえば「xをf(x)に置き換える」操作で、分布の歪みを抑えたり、分散を安定させたり、関係を線形に近づけたりする狙いがあります。
代表的な手法は、対数変換やBox-Cox変換、標準化(平均0・分散1)、Min-Maxスケーリング、順位変換、ビニング(区間化)などです。カテゴリ変数ならワンホットやターゲットエンコーディングを使うこともあり、モデルの前提や用途に合わせて選ぶ必要があります。
運用で重要なのは、変換の定義とパラメータ(平均との差、標準偏差など)をデータパイプラインに固定し、再現できる形で管理する点です。学習データから算出したパラメータを検証・本番にも使う一方で、全データで先に計算するとリーケージになるため、算出範囲のルールを明確にします。対数変換でゼロや負の値が混ざる場合の扱い、逆変換して解釈できる形にするかも、事前に決めておくと事故が減ります。

