ヒストグラム・度数分布からモードを決める場合

 名目データ,順序データでは平均やメジアンを計算できませんので,モードが代表値となります.しかし,一方,離散データ,連続データの場合,集めたデータから直接,モードを求めてもあまり役に立つ代表値とはいえません.

15の階級に分けた場合
 例えば,1000羽の日本ウズラの雄の体重のデータを5つの階級に分けた場合,下のグラフのようになり,モードは80g以上90g以下の階級となります.
例えば,直前のリンクで紹介した1000羽の日本ウズラの雄の体重のデータについて,元のデータからエクセルでモードを求めました.下のようにモードは計算できませんでした.1000羽のデータであっても,数値データでは同じデータが一つもないならモードはないことになってしまいます.あるいは平均やメジアンから離れた値がたまたま2つあったら,それがモードになってしまいます.

戻る

 離散データ,連続データでは元のデータそのままからモードを出すのはあまり意味がありません.元のデータから度数分布,ヒストグラムを作成し,そこからモードとなる階級(範囲)を求めます.

 10の階級に分けた場合,下のグラフのようになり,モードは80g以上85g以下の階級となります.
 15の階級に分けた場合,下のグラフのようになり,モードは84g以上87g以下の階級となります.

 モードは1つしかないとは限りません.一番多いカテゴリーが2つ以上あるばあいもあります.例えば,名目データの場合でも,車の色を調べたところ,一番多い色が白と黒の2つあれば,モードは白と黒の2つあることになります.
 数値データで,階級をモードとしたときでも2つ以上モードがあるときがあります.

 下のデータは,100人について自分が10秒たったと思ったときにストップウオッチを押して,計時したときに,実際には何秒たっていたかを集めたデータです.この場合,モードが2つあり,9〜10秒と10〜11秒です.続く2つの階級がモードになっているからといって,合体させて,モードは9〜11秒としてはいけません.