[統計学]10.記述統計学〜図表の見方とヒストグラム〜

広告

前回の記事→徹底解説!共分散と相関係数の計算と意味

記述統計というのは図表の見方や書き方の学問でありまして、もちろん奥に進むほど難しくなっていきます。しかし、日常の統計で必要なところだけをあげるなら、非常に内容が薄くなります。学ぶところが少なくていいですね!

要するに記述統計は超簡単!

抑える内容は二つだけ、度数分布表ヒストグラムだけです!

1. 度数分布表

度数分布表というのは階級とよばれる範囲に何個のデータがあるか、というのを表にしたものです。

まず、10人の生徒が9点満点の試験を受けて、その結果が

2 3 4 4 6 6 6 7 7 9

となったとしましょう。

これでもうすでに度数分布表を作ることができて、下のようになります。

階級 度数
1~3 2
4~6 5
7~9 3

というようになります。これの意味は

1点から3点の範囲に2人の生徒が存在する。

4点から6点の範囲に5人の生徒が存在する。

7点から9点の範囲に3人の生徒が存在する。

ということです。意識してなくても度数分布表というのは今まで見かけたことがあると思います。

以上で本日の内容の半分終わりました!簡単ですね。

度数分布表というのはただデータをまとめた表だということを理解してください。

2. ヒストグラム(柱状図)

ヒストグラムというのは度数分布表をより視覚的にわかりやすくするために、グラフにしたものです。横軸を階級、縦軸を度数にしたものがヒストグラムですね。

さっきの度数分布表をヒストグラムにすると、下のようになります。

先ほどの度数分布表が視覚化され、わかりやすくなりましたね。

今回は階級が3つしかなかったですが、より多くなってくると、ヒストグラムのすごさが体感できると思います。

1点だけ注意があります。ヒストグラムや度数分布表には階級の幅をある程度自由に選択することができます。これを悪用して印象操作をしている場合もありますので、グラフを見る際には注意が必要です。また自分がヒストグラムを作成する際も、誤解を招かないようなデザインを心がけてください。

これで記述統計学の学ぶ内容を終わりました!

参考として、総務省統計局の家庭調査報告のURLを書いときます。

総務省統計局

ここでは世帯収入の平均や何にお金を使っているのかというデータが豊富にあるので、自分の実感を修正することができます。

世帯収入の中央値の年度毎の推移をみると、景気が良くなっているのかわかりますね!

それではここで記述統計を終えたいと思います。

次の記事→統計学を学ぶ前の確率の復習

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事