[統計学]23. 2変数の独立の調べ方とその意味

広告

前回の記事→2変数の連続型確率分布

前回まで2回にわたって2変数の確率分布について期待値や共分散などを計算していましたが、変数が複数ある場合に重要になってくる独立という概念について説明してませんでした。すでに高校数学で習っていることですが、確率分布ではどのように異なってくるのかを考えていきたいと思います。まずは独立について復習していきましょう。

2変数XとYにおいて

X=今日の北海道の天気

Y=今日の青森の天気

だった場合、当然XとYには何らかの関係性が生じるでしょう。青森が晴れているなら、北海道も晴れの確率が高いのではないかと推測することも可能です。

しかし、サイコロを2回振って、出目をそれぞれX,Yとした場合、XがYに対して、あるいはYがXに対して影響を与えることはありません。このようにお互いに影響を与えない事象を独立と言います。

サイコロの例で考えると、Xが1~3であり、Yが5となる確率を求めるときに、

通常ならば

と計算しますが、独立ならば

と分解することができます。天気の例ではこのような分解をしてはいけません。

それでは一般に2変数XとYが独立の場合、

と計算することができます。ここまで基本です。

XとYが独立であるときとそうでないときの大きな違い何かと言うと共分散に現れます。

XとYが独立な離散型確率分布として、E[XY]を計算してみましょう。

ということが成立しますね。逆にこれが成立すれば独立だということができます。もちろん連続型でも結果は同じになります。

では共分散の計算式は

となりました!

「XとYが独立」⇔「共分散=0」

という関係を覚えておいてください。

もうひとつ大事なのが、

V[aX+bY+c]の計算結果にも共分散が現れてましたね。

となってましたが、共分散が0ならば、

というようになりますね。これらの式は連続型でも離散型でも成立します。次回の中心極限定理の説明をする際に重要になってくるので、独立の意味と特徴を覚えておいてください。

今回は2変数の独立について学んでいきました。次回は多変数(変数がn個)の場合はどうなるのか考えていきます。

次の記事→超重要!中心極限定理の意味!

統計学のおすすめ本はマセマの確率統計がおすすめです、式変形が丁寧で何回な教科書に比べ理解がスムーズになるのでおすすめです!数学的にちゃんと理解したい方にはうってつけの一冊になるでしょう。

 

プログラミングのための確率統計も良いですね。プログラミングのためのとは書いてありますが、実際はプログラマでなくても読みやすい内容で直感的に理解できる説明でおすすめです。初学者にはこちらをおすすめします。

関連記事