[統計学]18. 標準正規分布ってなに?

広告

前回の記事→超重要!正規分布の確率密度関数

前回は正規分布の確率密度関数を学びましたね。もう一度確認すると、確率密度関数は下のような式でありました。

ここには二つの定数がありますね。それは期待値μと分散σ2です。つまり正規分布は一通りだけではなくて、「μ=1,σ2=10」のような正規分布や、「μ=85,σ2=100」のような正規分布が存在するわけです。そうすると、正規分布を分析しようと思った時、それぞれの正規分布の形が異なるために、毎回どんな形なのか考えなければなりません。この手間を省くために生まれたのが標準化というアイデアです!

標準化は以前偏差値とかを扱ったときに習いましたね。どんな分布でも、平均=0、分散=1という分布に変換できるのが標準化です。その標準化するための式は標準化された変数zを使って次のよう表せます。

 

つまり、確率変数XがX~N(μ,σ2)のとき、この変換を施せば

Z~N(0,1)となるわけです。

今回はこれを計算してみましょう。

標準正規分布の確率密度関数をg(z)とします。


の関係が得られますね。これを正規分布の確率密度関数に代入して見ましょう。しかし、ただ代入していいわけではありません。関数の変数変換するときはその微分をかける必要がありました。置換積分の公式を思い出してください。


これのインテグラルがないバージョンと思って変数変換していきましょう。


となります。よって

ということで、計算できました。正規分布に比べて、だいぶスッキリしているので覚えやすいですね。この期待値0、分散1の正規分布を、標準化された正規分布ということで、標準正規分布と呼ばれます。標準正規分布には定数がないので、グラフの形は一つに定まります。さて、ここでは「本当に期待値が0、分散が1なのか」確かめていきたいと思います。

期待値と分散を定義から計算しましょう!

なぜ、これが0になるかというと、は偶関数、zは奇関数なので、それらの積も奇関数になります。奇関数を全ての範囲で積分すると0になりますね!

続いて分散ですが

 

となるのですが、これを積分するためにちょっと準備をします。

この両辺を全区間で積分すると、

となりますよね。左辺は0なので、これを整理すると、

という式が得られます。これで準備が完了しました!分散の計算の続きをやっていきましょう。

 

これで計算できると思ったのですが、この積分は知らないとできません。ガウス積分と呼ばれていて大学レベルの積分の公式です。知らなくても大丈夫です、多くの大学生も知りません。これは次のようなものです。

という公式です。今回はこれのa=1/2のときの公式になるので

ということで分散が1となることも確認できました。ちょっと難しいですが、これはできなくてもいいので、なんとなく読んでおけば良いかと思います。

今回は計算が多く、標準正規分布の図や標準正規分布表などは次回に回したいと思います。

次の記事→標準正規分布表の見方を解説!

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事