[統計学]17. 超重要!正規分布の確率密度関数

広告

前回の記事→相関係数と確率密度のおさらい

前回は確率密度関数などの演習をやっていきましたが、今回は統計学の中でも超重要な確率分布である正規分布(ガウス分布)を学びます。まず正規分布の重要性を説明していきます。

正規分布は英語ではnormal distributionと書かれるんですが、つまり確率分布の中でも最もノーマルなものだということです。

正規分布の概形を書くと下のような図になります。

この形はよく釣鐘型と呼ばれます。

工場の製造誤差からテストの点数から身長、体重まで、多くの事象の分布が正規分布に従うと言われています。さらに後に説明する中心極限定理というものがありまして、ある程度サンプルが多ければ、サンプルの平均はなんでも正規分布に従うという定理です

なんとなく重要であることが理解できたと思います。実際に学ぶとそこまで難しい訳ではありませんのでやっていきましょう。(上級編では正規分布をベルヌーイ分布から導いていくのですが、初級編ではそこまでする必要はありません。)

まずはっきりさせておくことがあります。それは

正規分布もただの連続型確率分布

ということです。なので以前習った連続型確率分布の特徴を全て持っています。

また、連続型確率分布だったら、確率密度関数があるはずですよね?

当然、正規分布も確率密度関数があります。期待値μ、標準偏差σの正規分布の確率密度関数は次のように表されます。

(-∞<x<∞)

このeという文字はネイピア数あるいは自然対数の底のe(=2.71828…)と呼ばれます。自然対数の意味がわからなくても、だいたい2.7くらいなんだなと覚えておくといいと思います。そしてこのeの何乗という表記はよくあります。そうするとちょっと文字が見にくいことになるので、eは指数を意味するexponentialの略なので

と表すことがあります。

この記法を用いれば先ほどの確率密度関数は

ともかけます。自分で書く時は自分のやりやすい方法で構いませんが、このサイトでは見やすくするためにexp()の記法を使っていこうかなと思います。

正規分布の確率密度関数は何回も書くことになるので、一応この確率密度関数の導き方は上級編でやるのですが、もう丸暗記しちゃった方が早いと思います。私なんかは下のようなイメージで覚えています。

勉強している方は何度も書くことになるので覚えていくことでしょう。正規分布の特徴を挙げるためにもう一度図を下に載せます。

まず言えることは、期待値μを中心に左右対称な図形であることです。そして左右対称ということは、期待値=中央値=最頻値が成立します。

確率密度関数に対してμ=0として左右対称な図形であることを証明してみましょう。

期待値が0であればこの正規分布はy軸を中心に左右対称なはずです。つまりf(-x)=f-x)が成立するはずですね!これを証明してましょう。

 

と言うわけで正規分布が左右対称であることが証明できました。もちろんこの左右対称な図形をμだけ平行移動させても左右対称であることには変わらないです。

最後に確率変数Xが期待値μ、分散σ2の正規分布に従うとき、

X~N(μ,σ2) (このNはnormal distributionの略です)

と表したりします。期待値が3、分散が4であれば

X~N(3,4)という風な感じです。そして正規分布は

  • 期待値から±σの範囲に約68%
  • 期待値から±2σの範囲に約95%
  • 期待値から±3σの範囲に約99.7%

の要素があります。わかりやすく図にすると下のようになります。

つまり、X~N(3,4)であなたが7点を取ったすると、標準偏差は2なので、

μ+2σのポジションにあなたはいます。図を見ると

あなたは上位2.5%の範囲に入ってることが一目でわかります。

これが正規分布の便利なポイントですね。次回の標準正規分布ではもっと便利になりますよ!

ちょっと長くなってしまいましたが、今回は正規分布の確率密度関数を中心に学んでいきました。次は正規分布を標準化して標準正規分布を作っていきます。

次の記事→標準正規分布ってなに?

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!

プラグラミングのための確率統計もすごくおすすめです!直感的に理解できるように分かりやすい説明で初学者でも十分理解できる内容と思います!

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事