[統計学]25. 推定と信頼区間とは?仮説検定がこれでわかる!

広告

前回の記事→超重要!中心極限定理の意味!

中心極限定理から、母集団がどんな分布であろうと、母分散がわかっており、標本数が多ければ、標本分布は正規分布に従うことがわかりました。

これを応用することで、母集団の平均μを推定することができます。推定ということは、当然、平均μを完璧に求めることができず、だいたい平均値はこの辺にあるよ〜という具合に、ある程度の範囲があります。これを信頼区間と言います。

99%の確率で平均値がその範囲にある場合、99%信頼区間と言います。良く使うのは95%信頼区間と99%信頼区間だと思います。95%信頼区間だと、平均値μの範囲を狭めることはできますが、平均値μがその範囲に入っていない確率が5%あります。99%信頼区間は信用性が高いぶん、平均値μの範囲が広がってしまいます。どっちを使うかは用途によります。ミスが許されないシリアスな状況だと99%を使うのがベターです。

それでは例題を見て信頼区間を求めていきましょう!

例題. 1万人が受験した100点満点の試験の平均点μを調べたい。母分散は16であるということがわかっている。100人に調査をしたところ、その平均点は60点でした。この試験の平均点μの95%信頼区間を調べてください。

文字で説明してから数式で解いていこうと思います。

まず、下の図の左のグラフを見てください。

これは標準正規分布において、-1.96〜1.96の範囲に95%の要素がありますよね。

中心極限定理から、標本分布は正規分布に従います。これを標準化してあげれば、母平均μの入った式になります。これを解くと、平均値μの95%信頼区間が求まります。

まずZを標準正規分布とすると、

ということが標準正規分布表からわかります。

標本分布は正規分布です。標準化の式は

ですからこれに数値を入れると

となります。これを一番最初の式に代入しましょう!

となって、平均値μの95%信頼区間は56.834〜63.136ということが求まりました!100人を調べるだけで、ここまでの精度で母平均を求めることができるのです。

この信頼区間の求め方を一般化して、公式にすることも可能ですが、ただの計算の手作業になってしまって、意味を考えることがなくなってしまいます。毎回、正規分布から導いてもそこまで計算は大変ではないので、毎回意味を考えて解いたほうがいいと思います。

この問題の99%信頼区間の計算は省略しますが、

としてあとは同じですね。これを計算すると、

となります。実感として、100人を調べるだけで、ここまで計算できるのは驚きではないでしょうか?といっても中心極限定理は万能ではありません。そもそもこれはnが十分大きいときでないと、標本分布は正規分布になりません。この1万人受けたテストのうち、100人の調査というのは十分大きいのかどうかという議論が必要であると思われます。

次の記事→理解しとかないとやばい!中心極限定理の弱点とは?

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事