8.今までのまとめと演習1

さて、今まで統計学の基本的な事項を学びました。応用を学ぶにあたってこれらの知識をマスターしておくと学びやすいと思うので演習問題を用意しました。

その前に今までの知識をまとめましょう。

ある分布に対して、

平均値:img_0003_2

分散:img_0004

標準偏差:img_0012

変動係数:img_0027

これが1変数かつ分布が一つのときに使われる統計値です。

そしてある分布を平均0、分散1に標準化するには

img_0017

とすればよかったんですね。

T得点(偏差値)を知りたいときはこれに、

img_0026

とすれば偏差値が得られます。(平均50、標準偏差10ですね)

このへんの知識を使って実際に手を動かすことをお勧めします。

(問題)A~Eの5人がテスト受け、結果が下の表になりました。

ABCDE
国語67458
数学84585
物理35678
化学78227
地理66498

(1)Aくんの平均値、中央値、最頻値、分散、標準偏差、変動係数を求めましょう。

(2)5人の数学の得点の平均値、分散、標準偏差を求めて、Eくんの数学の偏差値を求めましょう。

(解答)

(1)

平均値 = 6

中央値 = 6

最頻値 = 6

分散 = 14

標準偏差 =

変動係数 =

平均値、中央値、最頻値が一致したのはたまたまです。

どれも10点満点のテストなので、変動係数を求める必要はありません。(練習なので問題にしました。)

(2)

平均値 = 6

分散 = 10

標準偏差 = 

ここで、まずEくんの標準化得点(z得点)を求めると

これを10倍して50足すと偏差値が求められるので

となり、偏差値は56.3と求めることができました。

これでなんとなくイメージがつかめたと思います。

今までは一つのデータ(1次元データ)を対象に分析しました。次回から2次元データを対象に分析していきます。

例えば、

クラスの数学の得点だけなら1次元データ

クラスの生徒の身長と体重となると、データが2種類あるので2次元データとなります。

やることはこれまでとなんら変わりませんが、計算が煩雑になるので頑張っていきましょう。

次回は9.(2次元データ)共分散1