サンプリングとは、母集団(全体)から一部のデータを抽出し、その一部をもとに全体の傾向を推定する手法です。全件を集めたり処理したりするコストが高いときに、調査や分析を現実的な範囲に収める目的で使われます。
代表的な方法には、無作為抽出(ランダムサンプリング)、層化抽出、系統抽出などがあり、目的に合う抽出方法を選ぶ必要があります。たとえば年代や地域で偏りが出やすい調査では、層ごとに一定数を取る層化抽出が有効でしょう。
サンプリングでは、抽出の偏り(サンプリングバイアス)があると推定結果が歪むため、母集団を代表するデータになっているかを確認します。さらに、サンプル数が少なすぎるとばらつきが大きくなるので、許容できる誤差や信頼水準を前提に必要数を見積もるのが一般的です。

