メジアンとモードについて

1.メジアン

 分布が偏っている場合には平均よりもメジアンの方がよい場合があります.例えば,下のグラフは平成11年度の給与所得分布を表したものです.

上のデータの平均は461万円です.平均は高額所得者の値によって,大きな影響を受けます.そのため平均の給与所得よりも少ない給与の人の方が多いことになります.そういうことを知らないと,平均の給与が461万円ときいて,自分は世の中の真ん中より下なのだと思ってしまいます.しかし,真ん中の値メジアンは461万円よりは小さい値です.
 このように平均を使うとときに集団のもっともふつうのところを見落としてしまいます.
 何か新しいものを売り出すときに,これは中流階級向けだから平均所得461万円の人を調査したらどれがうれるかわかるだろうと考えると,少し高額所得者(しかも全体からの割合は少なくなる)向けの商品を選択してしまうかもしれません.
 こういうときにメジアンを使うのがひとつの場合です.体重は正規分布しそうですが,アメリカ人50歳の男性の場合は極端に肥満の人がいるので,メジアンがよいそうです(生物統計学 共立出版P44から)

戻る

 それ以外にある製品の耐久性をしりたい,ある鳥がふ化してから何歳になったら求愛行動をとるのか知りたいという場合にもメジアンが有効です.耐久性を調べる場合,一番耐久性のあるものが壊れるまで調べると時間がかかりすぎるかもしれません.その場合は大半が壊れたら,実験を終えて,半数が壊れたところ,すなわちメジアンを代表とすればよいことになります.

鳥の場合,一生,求愛行動を始めない個体がいたり,なかなか始めない個体がいると研究者はいつまでたってもデータをまとめられません.大多数の鳥が求愛行動を始めた時点で調査を打ち切って,メジアンを代表値とするわけです.

2.モード

量的なデータではモードはあまり利用されません.とくに連続データでは階級の切り方でモードが変わります.しかし,色,性別など名目(質的)データではモードを代表値とします.車の色を混ぜ合わせて,黒くなったから平均は黒といっても意味ないですね.

下のデータでコシヒカリのヒストグラムを2種類書いてみました.

上のように階級の切り方のよって,モードが変わってしまいます.