トップページへ
第4回 正規分布
1.正規分布
 前回の授業では二項分布とポアソン分布という2つの離散分布と矩形分布と正規分布という2つの連続分布について学びました.正規分布については今回の授業でさらに詳しく学びます.正規分布は自然界で起こる現象の多くがその分布に当てはまること,特に平均値に関する分布が当てはまることから,統計学では最も重要な分布となっています.
 それではまず,正規分布の特徴を以下に列記します.
平均μ,分散σの正規分布はN(μ,σ)と表記され,以下のことがいえます.
  1. 平均μを中心にして,左右対称である.すなわち平均とメジアンは一致する.そして,平均より大きい値あるいは小さい値を取る確率はどちらも1/2である.
  2. 曲線は平均μの近傍で高く,両側に行くにしたがって単調に低くなる.
  3. 平均μは曲線の位置を決める.平均μのみ異なる2つの曲線は左右に移動させれば重ねることができる.(参考図
  4. 標準偏差σは曲線の形を決める.σが大きければ曲線は扁平になる.(参考図
  5. μ-σとμ+σの間の確率変数を取る確率は約0.68である.(参考図
  6. μ-2σとμ+2σの間の確率変数を取る確率は約0.95である.(参考図
  7. μ-3σとμ+3σの間の確率変数を取る確率は約0.997である.(参考図
  8. 0.95(95%)の確率でμ-1.96σとμ+1.96σの間の確率変数をとる.(参考図
  9. 0.99(99%)の確率でμ-2.576σとμ+2.576σの間の確率変数をとる.
 正規分布の特徴を具体的に考えてみましょう.20〜24歳の男性の身長は人間生活工学研究センターの調査(1992-1994)によると,平均(μ)170.5cm,標準偏差(σ)5.9cmでした.このことから2σ以上平均より背の高い人,すなわち182.3cm以上の人は全体の2.2%になります.平均から標準偏差以内,すなわち164.6〜176.4cmに全体の68%が属します.全体の95%は158.9〜182.1cmに属します.
身長が正規分布に従うとするとどうなるか?
2.標準正規分布
 正規分布を示す関数は複雑なので,計算機のない時代には自分の調べたい正規分布を標準正規分布になおして,正規分布表をみて,自分の調べたい正規分布がどのようになっているかを求めました.平均μ,標準偏差σの正規分布N(μ,σ)の確率変数xを標準正規分布N(0.1)に直すには次のzを求めます.
 z=(x−μ)/σ
 zは標準正規分布に従うので,例えばz≧1となる確率は約16%,-1≦z≦1となる確率は68%です.正規分布表には通常,zの上側確率(z値より大きい値を取る割合)が載っています.例えばz=1.45のところを読むと,0.0735とありますから,z≧1.45となる確率は7.35%であるということがわかります.
 それではある正規分布が得られたときに,ある確率変数より大きい値を取る確率を求めてみましょう.前の身長の例(平均170.5cm,標準偏差5.9cm)を例にしましょう.まず標準正規分布に直す式は
 z=(x-170.5)/5.9となります.
例えば,180cm以上の人は全体の何%でしょうか.
 z=(180-170.5)/5.9=1.610ですから,正規分布表で1.61を読むと0.0537です.
したがって,180cm以上の人は全体の5.37%います.
 このようにすれば,正規分布に従う分布において,ある確率変数を取る確率を標準正規分布になおして求めることができます.しかし,現在ではパソコンで統計解析するので,わざわざ標準正規分布になおして求める必要はなくなりました.
エクセルでの正規分布の計算
3.二項分布とポアソン分布の正規分布での近似
 計算機の発達していない時代では二項分布とポアソン分布の計算はかなり面倒でした.いまでもnの大きい二項分布は正規分布に近似した方がよい場合もあるかもしれません(あまりに大きい階乗を計算するとエラーになることもあるし,桁落ちして誤差が大きくなりやすいので).しかし,たいていの用途ではパソコンで統計解析するときには,二項分布やポアソン分布のままで計算できるでしょう.
二項分布を正規分布で近似する.
ポアソン分布を正規分布で近似する.
4.次回の授業ではあるデータが正規分布あるいは二項分布に基づくと仮定して,統計的に推定あるいは検定を行う.例えば,平均m,標準偏差σの正規分布では平均から3σ以上離れた値の出現する確率は0.3%しかない.このことから逆にそのような値が得られたら,元の平均と標準偏差が怪しいと考えることもできる.このような考え方を統計的推定あるいは検定という.今回は次の実験を行う.
正規分布の例:ウズラの雄の体重
 全く実力の同じ者が勝負をすれば,勝つ確率は2分の1であるといえる.逆に実力が違えば,勝つ確率はその実力差に応じて変わると考えられる.このときn回勝負したときに,x回勝つ確率は二項分布に従うと見なせる.
 2人で行う勝負(じゃんけん,将棋,相撲なんでもよい)を20回以上行え.もし実力が同じだとした場合,その結果の得られる確率を求めよ.その確率から,両者の実力に差があるのか,ないのかを考えて見よ.(2人1組の班で調査してもかまわない.相手がコンピューターでもよい)
 なおじゃんけんのような場合では勝つ確率を2分の1として考えること.(あいこは決着がつくまですることによって勘定しない.)
ポアソン分布を正規分布で近似する.
二項分布を正規分布で近似する.
3.第2回の宿題で調べた2.a.とb.について,正規分布で近似して,確率分布を求めよ.
実験計画学のトップページへ戻る

トップ アイコン
トップページヘもどる

実力の同じ2人が20回勝負するときの結果を二項分布で計算するとこのようになります.
2.第3回の授業の宿題で調べたデータについて,正規分布で予想される分布とどの程度離れているのかを以下の手順で検討せよ.
a.調査したデータの標本平均,標本分散をそれぞれ母平均,母分散とする正規分布とすると,68.3%の確率変数はμ−σ〜μ+σの間に入る.自分の調べたデータのうち,何%がμ−σからμ+σの間に入るかを調べよ.
b.さらにμ−2σ〜μ+2σ,μ−3σ〜μ+3σの間に入るデータについても調べよ.
c.a.,b.の結果から,自分の調査したデータが正規分布に近いかを検討せよ.
b. a.で求めた確率分布のヒストグラムの上に,先週,調べたデータから作ったヒストグラムをトレーシングペーパーなどで書き写したものを重ねて,2つの違いを検討せよ.もし,大きく異なるときはなぜかを考えてみよ.
a. それぞれ二項分布,ポアソン分布に従っているとして,確率分布を求めよ.なおポアソン分布の計算で用いる母平均μは調査したデータの平均を用いたらよい.
ポアソン分布の例:交通事故死者数
二項分布の例:さいころを振って1が出る回数
宿題
1.第2回の宿題で調べたデータについてa.は二項分布,b.はポアソン分布で予想される分布とどの程度離れているかを以下の手順で検討せよ.