度数分布とヒストグラムにおける階級と階級間隔の決め方
 ここでは、度数分布とヒストグラムの書き方を紹介します。3つの方法を列記するだけですので、各人が好みの方法を採用してください。
方法1
 応用統計ハンドブック(応用統計ハンドブック編集委員会編:養賢堂)p12に基づく方法
  1. データの数nを求める。度数分布表を作るにはnは少なくとも50、できれば100以上必要である。
  2. データを大きさの順に並べる。
  3. 範囲Rを求める。データの中から最大値maxと最小値minをみつけ、範囲を計算する。 R=max-min
  4. 階級間隔hを決める。範囲Rを10〜20の適当な数で割る(この商をkとする)。階級間隔を測定値の測定単位の整数倍とするためにkを整数値になるように丸める。このときデータ数が100より少ないときはkを大きめの値に丸め、100以上のときはkを小さめの値に丸める。
  5. 階級分けの出発点を決める。最初の階級は最小値を含み、階級間隔hであり、次の階級との境界値は共通し、しかもデータが2階級にまたがらないように、決めなければならない。そのため、最小値から測定単位の2分の1を引いた値を階級の出発点とするとよい。(こうすると階級の境界値は測定単位の整数倍プラス測定単位の2分の1となり、境界値にデータが重なることはなくなる。)
  6. 出発点の値に階級間隔hを逐次加え、最大値を含む階級までの境界値を決定する。
  7. 度数分布表を作成する。各階級の中央の値をその階級の階級値とする。
  8. 次にヒストグラムを作成する。横軸に階級の境界値を取る。
  9. 縦軸に度数を目盛る。このとき、できる図形の縦・横の比が2:3程度になるのがよい。
方法2
 入門統計解析法(永田靖著:日科技連)p9に基づく方法
  1. データの測定単位m(測定値の最小の刻み)を明確にする。データ数をnとする。
  2. データを大きさ順に並べ、最大値max、最小値min、範囲Rを求める。
  3. 仮の区間の数hをh≒√nをもとにして決める。
  4. 区間の幅cをc≒R/hをもとにして決める。この際、cは測定単位mの整数倍に丸める。
  5. 各区間の境界値を次のように決める。一番下の下側境界値をmin-m/2とする。これに区間の幅cを順次加えていって、各区間の境界値とし、maxを含むまで繰り返す。
  6. 区間の中心値をその区間の上側と下側の境界値の平均として求める。
  7. 各区間に入るデータの個数、すなわち度数をチェックし、数え上げる。
  8. 次にヒストグラムを書く。度数分布の区間の境界値を横軸に、度数を縦軸に取る。
  9. 度数分布に基づいて、それぞれの区間の度数に応じて柱を描く。
  10. 平均を示す線を書き込み、ヒストグラムの余白にサンプル数、平均、標準偏差を書き込む。
方法3
 新版生物統計学入門(新城明久著:朝倉書店)p10に基づく方法
  1. 区間の数(級)をスタージェスの式によって決める。
  2. スタージェスの式とは級数C=1+3.32log10n  (n:サンプル数)
  3. レンジ(範囲)を算出する。
  4. 区間の幅を決める。 区間の幅=レンジ/区間の数(級数)
  5. 階級間隔を測定値の測定単位の整数倍とするために区間の幅を整数値になるように丸める。
  6. 後は上の2つの方法と同様である。
実験計画学のトップページへ戻る

トップ アイコン
トップページヘもどる