[統計学]26. 理解しとかないとやばい!中心極限定理の弱点とは?

広告

前回の記事→推定と信頼区間とは?仮説検定がこれでわかる!

正規分布と中心極限定理を学んできましたね。これを使って、信頼区間を求めることもできたと思います。それでは実際に運用するための前提と結論をわかりやすくまとめましょう。

まずは中心極限定理の前提と結論ですね。

前提1: 母分散がわかっている

前提2: 標本数が十分大きい

結論  : 標本分布は正規分布に従う

という形です。この結論から標本分布を標準化して、母平均を推定することができました。

ここで母集団はどのような分布でも使えるというのが中心極限定理の強力なところです。

逆に母集団が正規分布に従うと知っている時はどうなりますか?

正規分布からいくらか標本を取っても、その標本分布は正規分布になります(正規分布の再生性)。この事実を使うと、標本数が多くなくても同様に信頼区間を推定することができます。つまり、これをまとめると

前提1: 母分散がわかっている

前提2: 母集団は正規分布に従う

結論  : 標本分布は正規分布に従う

ということになりますね!

それでは母集団が正規分布が否か、標本数が多いか少ないかで下の表にまとめました。

母分散 母集団

正規分布

母集団

正規分布じゃない

知っている。 標本数大 パターン1 パターン2
標本数小 パターン3 パターン4

パターン2では中心極限定理から標本分布は正規分布に従います。

パターン3では正規分布の特性から標本分布は正規分布に従います。

パターン1は標本数が大きく、かつ母集団も正規分布ということで、標本分布は正規分布に従います。

パターン4、つまり標本数が小さく、母集団が正規分布とは言えない時はどうしますか?

標本数を多くするために、調査を進めることも一つの解決策ですが、何しろコストがかかります。こういうときは、「母集団は正規分布に従う」と仮定して見ましょう。そうすると、母平均μを推定することができますね。あくまで仮定の上での話なのですが一つの目安になると思います。

さて、ここまでつらつらと述べてきましたが、中心極限定理すごいじゃんって思う方もいるかもしれませんが、重大な欠点があるのですね。

それは、

母分散がわかっているのに、母平均がわからないっていう状況はあるの?

ということです。普通に考えれば、母分散を知るためには全数調査が必要で、全数調査をすれば母平均も求まるはずです。今まで中心極限定理は強力だとか言ってましたが、実際に使えることはあまりありません。しかしこの考え方は非常に重要なので今まで解説をしてきました。

次の記事→ベイズ統計学の話とオススメ本

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事