第2回 平均と分散・データの要約
A.データの要約
たいていの場合,代表値としては平均,分散,標準偏差,変動係数(%)を計算すればよいでしょう.メジアン,四分位範囲などは後で述べるように分布が偏っているときに計算するといいです.平均,分散,標準偏差を数式でかくと,Σ(シグマ)という記号がでてきて,びっくりするかもしれません.エクセルで計算するときはそういうことはわからなくても大丈夫です.平均,分散,標準偏差が意味することをしっかり理解しましょう.
分散とその正の平方根である標準偏差がばらつきの指標としてよくつかわれます.四分位範囲はあまり使われませんが,メジアンを利用する方がよい場合にはこちらの方がよい指標です.とくに調査を途中で打ち切る標本では四分位範囲を使うことになるでしょう.
中心化の傾向を表す代表値にたいして,その中心からおのおののデータがどれぐらい離れているかを示すのがばらつきを評価する指標です.
2.ばらつきを評価する指標として
D.要約されたデータから何をよみとるか
1.中心化の傾向を表す代表値として
中心化の傾向を表す代表値としては,平均(算術平均),メジアン,モードの3つがあります.一般的には平均を使うことが多いですが,分布が偏っているとき,あるいは途中で調査を打ち切るようなデータではメジアンが使われ,名目(質的)データではモードが使われます.
中心化の傾向を表す代表値は位置の統計量ともいいます.
1.データの全体的な傾向を表す表にまとめます.大きさの順にデータを並べます.度数分布表を作ります.
2.ヒストグラムなどの図をかきます.
3.平均など中心化の傾向を示すような値を求めます.
4.ばらつきを評価する値を求めます.
C.データの要約の手順
B.代表値の計算の実際