第6回 統計的推定

第6回の授業で配布したプリント(PDF)
 前回の授業から,標本数が十分に多ければ,母集団の分布によらず,標本平均の分布について,次のことがいえることがわかりました.
① 母集団の分布にかかわらず,標本分布は正規分布に近い形となります.
② 標本の平均は母集団の平均とほぼ等しくなります).
③ 標本平均の分布は,標本数が少ないと大きくばらつき,標本数が多いとあまりばらつかなくなります.

1.統計的推定と検定

 わたしたちはふつう統計データを集めるのは,データを集めた標本そのものに関心があるのではなく,標本をそこから無作為抽出した母集団について何か知りたいから,標本を取り出し,データをとります.わたしたちは母集団そのものについては完全に知ることはいろいろな事情で不可能ですが,標本については具体的なデータ(統計量)を得ることができます.さて,この標本の統計量から母集団の母数を推論できるのでしょうか?そしてどのようにして・・・

3.統計的推定
1) 点推定 1つの値で母数を推定します.
例: 朝酌川で無作為に数地点を選び,鯉を釣った.鯉の体重の標本平均は5.0kgなので,朝酌川の鯉の平均体重を5.0kgと推定した.
 標準誤差はエクセルでは以下のリンクに載せた方法で計算することができます.
  1. 標本平均の期待値は母平均μに等しい.
  2. 標本平均の分散は母分散の1/nに等しい.
  3. nが十分に大きいときは大きさnの標本の標本平均は正規分布に近似できる.
 統計的推測のために母集団から抽出した標本数nの標本から求めた標本平均の分布は次の性質を持ちます.

生物統計学のトップページに戻る

 しかし,標本平均だけをつかって,母集団の母平均を点推定した場合,その推定がどの程度信頼できるのかがわかりません.例えば,試験の成績の母集団において,母平均がほぼ50点,母標準偏差ほぼ15点であるときに5つの標本から母平均を点推定したらどうなるでしょうか?
2) 区間推定 母数をある幅を持つ信頼区間とともに推定します.
例:朝酌川で無作為に数地点選び,鯉を釣った.サンプル数100匹の鯉の体重の標本平均5.0kg,標準偏差2.0kgなので,朝酌川の鯉の平均体重は95%の信頼区間をつけて,5±0.39kgと推定した.このとき,母集団(朝酌川のすべての鯉)の母平均μは95%の確率で4.61<μ<5.39kgの範囲にはいる.
 信頼率は統計量を使用する目的に応じて決定します.95%信頼区間の場合,100回のうち5回,区間推定の値に母集団の平均が含まれない(すなわち推定を誤る)ということが起こります.信頼率を高める,例えば100%にしたらよいのではと考える人もいるかもしれませんが,そのときには信頼区間はきわめて大きくなり,役に立たなくなります.例えば,視聴率の100%信頼区間は0~100%だというようなもので,疑いはできませんが,この数値では何の役にも立ちません.信頼率は必要に応じて設定します.
標本平均から母平均を点推定するときのばらつき
標準誤差の計算(練習問題)
エクセルでの標準誤差の計算方法
 このような標本平均の性質から標本平均が母平均を推定するための目安として,標準誤差を計算することができます.標準誤差SEとは標本平均の標準偏差のことです.母集団の標準偏差をσとすると
 統計的解析においては,たいてい母集団の平均を推測するために,標本を集めるのがほとんどですからこのような標本平均の分布は特に重要です.母集団がたとえ正規分布にかなりはずれた分布をしていても平均について論ずるならば,ある程度の数の標本を集めれば,標本平均は正規分布に近似できます.
2.標本平均の分布
エクセルを用いた,大きな標本から母平均を区間推定する方法
  統計的推論には統計的推定と統計的検定の2つがあります.
推定:統計的に標本の統計量から母集団の母数を推測することを統計的推定といいます.
例: 視聴率調査を200人に対して行い,番組Aの視聴率を推定した.

検定:統計的に標本の統計量から母集団の母数に関する予想の真偽を検証することを統計的検定といいます.したがって,イエスかノーかを判定することになります.
例: 視聴率調査を200人に対して行い,番組Aの視聴率が20%以上あるのかを検定した.
例: A社とB社の車の排気ガスに含まれる窒素酸化物はA社の方が多いのかを検定した.
標本平均から母平均を区間推定するとどうなるか?