[統計学]12.確率分布と確率変数の基礎

広告

前回の記事→統計学を学ぶ前の確率の復習

前回は確率の復習をしました。この確率という考え方が統計を分析する上で役に立って来ます。選挙速報も当選確率が限りなく100%に近いときに当選確実を出しています。よく知られている分布のモデルがたくさんあるので、このデータはどのモデルを使うのが適切か考えると解析することは難しくありません。
序文が長くなってしまいましたが、今回は確率分布の話になります。

今まで習っていたのは単なる分布で、全ての分布は1次変換で確率分布に直すことができるはずです。

身長の分布は単なる分布ですよね、ある変換を施すとこれを確率分布にすることができます。この変換をすると意味が変わってきます。元々は身長xの人は何人いるのかという意味から、ランダムに1人選んだときにその人の身長がxとなる確率はいくらかという意味になるわけです。このように変換することでどのモデルに当てはまるのか考えていくわけです。その変換は後で習いますので、確率分布に関する知識を深めて行きましょう。

確率分布には離散型確率分布と連続型確率分布の2種類あります。xが確率変数として、xが起こるときの確率をf(x)と表します。このf(x)を確率密度関数と言います。このxがとびとびの値を取るときの分布は離散型確率分布となります。サイコロを振ったときとかがそうですね。サイコロを振って1.4とかの値は出ません。こういうのが離散型となります。

離散型確率分布といのは単純に

f(xk)=P(X=xk) (k=1,2,・・・)

のf(xk)が離散型確率密度関数になります。

連続型は逆にxが連続的に存在するときが連続型確率分布になります。連続型は後ほど詳しくやるので今回は置いておきます。
まず、両者に共通する確率分布の特徴を考えてみましょう。

確率分布は確率がどうなるかの分布なので、マイナスの値を取ることがありません。
さらに全ての確率を足し合わせると1になるのが確率の特徴になります。
この全ての確率を足し合わせるというのは、離散型であればΣ、連続型であれば積分ですね。

ここまでの内容をまとめると以下の図になります。言葉より図で理解する方が早そうですね。

これで確率分布がなんとなくどういうものわかってきたと思います。

次の記事→離散型確率分布の基本

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事