本記事は、統計学検定3級でも出題される「幹葉図」について解説しています。
目次
1.幹葉図とは?
幹葉図とは、以下のような図のことです。別名「幹葉表示」とも呼ばれます。
データの数値は幹と葉で構成されている
幹葉図は、「幹」の部分が10の位の数を、幹に対応する「葉」の部分が1の位の数を表しています。
この幹葉図において、幹と葉は対応しており、2つを合体させることで1つの数値になります。
例えば上の図では、幹が「1」の行の要素は本来「12,13,14,15,18,19」です。「度数」とは各区分における要素の数を表しており、幹葉図に表示される場合とされない場合があります。
幹葉図の作り方
次のプロセスで幹葉図を作成することができます。
- データの数値を「幹」と「葉」に分解する(10の位と1の位に分ける)
- 左側に「幹」となる桁の数字を下に向かって昇順に並べる
- 右側に幹と対応して「葉」となる1桁の数字を右に向かって昇順に並べる
具体的には、以下のような見た目になります。この図は50点満点のテストの結果を幹葉図にしたものです。
統計データ可視化を成功させる95のチェックリストをダウンロードする
2.幹葉図のメリットと注意点
続いて、幹葉図という視覚的表現のメリットとデメリットを解説します。
メリット:幹葉図にすることで分布がわかりやすくなる
幹葉図のメリットは、数値の分布が見やすくなることです。特に、最頻値や外れ値がわかりやすくなります。さらに、ヒストグラムと比べて1つ1つの数値をはっきりと見ることができます。
ランダムに並んでいる数を幹葉図の形式に直してみましょう。以下が、ランダムに並べた数字の図です。
これを、幹葉図の形式にしてみましょう。そうすると値の分布がわかります。46点の生徒が2人、3点の生徒が2人いるのが最頻値だということもわかります。
ちなみに、同じデータをヒストグラムで表したのが以下です。ヒストグラムは分布はわかりやすいですが、各数値をひとつひとつ見ることはできません。
注意点:データ量が増えると幹葉図は機能させづらい
一方で、データ数が増えれば増えるほど幹葉図は見にくくなってしまいます。
こちらは154個のデータを並べた幹葉図ですが、分布はわかるものの数値があまりに多く表示されてしまい、理解するのは大変です。これくらいの量になると、「1つ1つの数値をはっきりと見られる」という幹葉図の良い面が発揮できていません。
ですので、数百、数千、数万といったボリュームの大きなデータを図やグラフにしたい際には幹葉図ではなくヒストグラムや箱ひげ図を使うのがオススメです。以下の記事も、ご参考にしてください。
3.統計検定3級における幹葉図の出題例
幹葉図は統計検定3級の出題範囲です。このように出題されましたので、参考までにご覧ください。
まとめ
以上が幹葉図の解説です。
統計検定3級の対策をされている方は、以下記事もぜひご覧ください。
コメント