[統計学]13. 離散型確率分布の基本

広告

前回の記事→確率分布と確率変数の基礎

復習ですが離散型確率分布は次のような確率密度関数を持つものでした。

f(x)=P(X=x) (xは飛び飛びの値を持つ)

そして確率の分布の特徴から以下のことが言えます。

今回は新しい概念である累積分布関数を紹介します。確率密度関数を-∞からxまで積分したものを累積分布関数F(x)と言います。

式で表すとこのような形ですね。これの意味は、x以下となる確率が求められるわけです。

この累積分布関数にも特徴がありまして、

xが大きくなるほど積分区間が広くなります。積分区間が広いほど累積分布関数は大きくなりますから、累積分布関数は単調増加(広義の単調増加)となります。

さらに、確率密度関数を全ての区間で積分すると1になるので、xが∞に近づくとき、F(x)は1に近づく、というようになります。

この特徴を数式で表すと

となります。

サイコロの例を使って図にすると以下のようになります。

ここまでは基本なので理解して覚えて置いてください。

これからは確率(統計)で超重要な期待値と分散の求め方をします!

確率変数には期待値(平均)があります。

期待値E[X]の求め方は高校でもやりましたが、一般的に次のように表すことができます。

実は期待値というのは基本編で学んだ平均となんら変わりません。

しかしこのE[X]というのは馴染みがないものですが、例えば

E[X2]やE[g(x)]というのはあとあと出てきますが、これらの計算は

というように求めることができます。

一般にE[X]というのはあくまでΣ記号とって何かをかけてるだけですから、線型性が成り立ちます。具体的に言うと、

こういう定数の掛け算や定数の足し算が分解できることを線型性と言います。

分散の求め方も基本編で学んだことと変わりません。確率のときでは分散はV[X]やσ2(シグマ)と表します。

これもわざわざ覚える必要はないんじゃないかというレベルですね。

このへんで離散型確率分布の基本を終わりにします。

離散型確率分布にはベルヌーイ分布やポアソン分布など習うときに使います。

次の記事→連続型確率分布を学ぼう

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事