6. 基本編(1次元データ)変動係数

さてさて、前回の復習ですが、AくんとBくんの分散及び標準偏差を求めました。

今回も同じことをするのですが、例がテストだけではつまらないので、新しい例でもやってみましょう。
例えば適当に選んできたパンダ5頭と犬5匹の体重が以下のようになったとします。(単位はkg)

12345
パンダ789410281115
5.29.76.24.87.1

※この表をよく見て、どちらの方がばらついているか考えて見てください。

そうすると前回学んだ方法でパンダと犬の体重の平均値と分散、標準偏差が求められはずです。実際に求めて見ましょう。

パンダの平均値

img_0013

犬の平均値

img_0014

パンダの分散

img_0015

犬の分散

img_0016

分散をそれぞれ平方根を取ってやると

パンダの標準偏差≒13.64

犬の標準偏差≒1.745

という結果が得られました。この結果は定義から導いたので確実に正しいのですが、どこか不自然な点があります。

それは、パンダの体重が犬に比べてばらついるという点です。

犬の体重の最小値は4.8、最大値は9.7と2倍以上の差があるのに対し、パンダはそれほど差がありません。ですが標準偏差を見るとパンダの方がバラついているという結果になりました。

絶対値として見るとパンダの方がバラついているのは確かですが、割合を考えると犬の方がバラついていますよね。

この割合を考えるために

標準偏差をその分布の平均値で割った値を変動係数と言います。

変動係数は英語で Coefficient of variationと書くのでよくC.V.と表されます。これを数式で表しますと、
\(\quad\quad\quad C.V. \quad =  \frac{s} {μ} \)

こうすると、異なる分布でもばらつきを比べることができます。

この場合、

パンダの変動係数:  13.64 ÷ 94 ≒ 0.145

犬   の変動係数:  1.745 ÷ 6.6 ≒0.264

となり、犬の方がばらつきの割合が大きいことがわかりました。

前回はAくんとBくんは同じ10点満点のテストだったので標準偏差でばらつきが比較できるのに対して、全く大きさが違う二つの分布でも、変動係数を使えば比べられることがわかりました。

思い出して欲しいのですが、標準偏差の単位は与えられたデータの単位と同じです、平均値の単位もデータの単位と同じです。

よって、変動係数には単位がないことを注意してください。

次は分布を標準化する方法を学んでいきたいと思います。

次回は7.(1次元データ) 分布の標準化と偏差値