確率分布

確率分布とは、確率変数が取り得る値と、その値が起きる確率の対応関係を表したものです。値が飛び飛びになる離散型と、連続的に変わる連続型に分けて整理します。

確率分布を使うと、平均や分散などを通じて「どのくらい起きやすいか」「どの程度ばらつくか」を定量化できます。サンプルから得たデータを確率分布で表現すると、予測や異常判定の前提が揃いやすいです。たとえばサイコロの出目は離散型、待ち時間や身長は連続型として扱うのが一般的です。

代表的な確率分布には、正規分布、二項分布、ポアソン分布などがあります。分布の形は平均や分散、発生率のようなパラメータで決まり、推定した分布が実データに合っているかを確認する必要が大切です。実データのばらつきは必ずしも理想的な形にならないため、当てはめの前提と限界も併記すると誤解が減ります。

お問い合わせ

サービスに関するご質問や講演依頼など、お気軽にお問い合わせください。2営業日以内にお返事いたします。

ビジネスの成果にこだわるデータ分析支援
データ分析/活用にお困りの方はお気軽にお問い合わせください
ビジネスの成果にこだわるデータ分析支援
データ分析/活用にお困りの方は
お気軽にお問い合わせください