第9回 カイ二乗分布とF分布

第9回の授業で配布したプリント(PDF)

以上の計算は,生物統計学_授業用データ集2010のファイルの第9回タブにある計算シートでも計算できます(データ100個以内).

3.カイ二乗分布を使った分散の検定
例:A,B2種類の飼料を与えて一定期間飼育したハムスターの体重の増加量を測定した結果,次のような結果を得た.飼料による体重増加量のばらつきに差があるのかを検定せよ.
1.カイ二乗分布
 母分散が既知の時に正規分布する母集団について,そこから抽出した標本の分散がどのような分布を示すかを表すのがカイ二乗分布です.カイ二乗分布は自由度だけで決定し,母分散の値σは関与しません.

以上の計算は,生物統計学_授業用データ集2010のファイルの第9回タブにある計算シートでも計算できます(データ100個以内).

F分布は正規分布する母集団から無作為抽出された2つの標本の分散の比に関する分布を示します.2つの標本それぞれの自由度からF分布が決まります.次回の授業から学ぶ分散分析ではF分布を利用するので,大切な分布です.なかなか意味をとらえにくい分布かもしれません.

以上の計算は,生物統計学_授業用データ集2010のファイルの第9回タブにある計算シートでも計算できます.

カイ二乗分布を用いて,ある標本の分散がある値であるかということを検定できます.
例:K牧場の牛の乳脂肪率の標準偏差は0.07%であった.新しい飼育法の導入で乳脂肪率にばらつきが変化したかを知りたい.12頭を無作為に調査した結果は以下の通りである.
7.02,7.03,6.82,7.08,7.13,6.92,6.87,7.02,6.97,7.08,7.19,7.15
エクセルで計算する場合,
母分散σは次の区間にp%の確率で入ります
エクセルによるカイ二乗検定
カイ二乗分布の形
p-値が0.50なので,帰無仮説は棄却できません.
したがって,5%の有意水準では飼料のばらつきに差があるとはいえないと結論できます.
2.カイ二乗分布を使った分散の区間推定
 カイ二乗分布を利用すると,標本から得られた分散を利用して,母分散を区間推定することができます.
F分布とは?(グラフで表すと・・・)
5.F分布
2つ以上の遺伝子座の場合
例:花色赤色・草丈が高い×花色白色・草丈が低いを交配したFはすべて花色赤色・草丈が高いとなった.F同士を交配した結果,以下の表のような結果を得た.これは9:3:3:1の分離比に適合するかを検定せよ.
4.カイ二乗検定の応用
 カイ二乗検定はメンデル遺伝の分離比や,計数(比率)データの標本(群)の差の検定にも利用できます.イエス-ノー,生-死など二者択一的なデータであるため範疇データとも呼ばれます.この場合には次の値を算出し,カイ二乗表に照らして検定します.
1.帰無仮説と対立仮説の設定
例:F1のエンドウの交配から赤花80,白花30を得た.3:1に分離するかを検定せよ.
自由度が1なので,補正した式(2)を用います.

帰無仮説は「分離比は3:1である」.一方,対立仮説は「分離比は3:1でない」
期待値は3:1に分離した場合にどうなるかですから,赤花82.5,白花27.5になります.したがって,
以上のことから帰無仮説(分散は変化しなかった)は1%の有意水準で棄却されました.したがって,乳脂肪率の分散は変化したと結論できました.
カイ二乗検定の応用:計数(比率)データの検定
遺伝子型 表現型 観察値Oi 分離比 理論値Ei
赤-高- 花色赤色・背丈が高い 65 9 160×9/16=90
赤-低低 花色赤色・背丈が低い 50 3 160×3/16=30
白白高- 花色白色・背丈が高い 30 3 160×3/16=30
白白低低 花色白色・背丈が低い 15 1 160×1/16=10
160 16
2.p-値の計算
 帰無仮説が成り立つとしたら,今回の標本が得られる確率であるP値はエクセルでは以下の式で計算します.

生物統計学のトップページに戻る

F分布を利用して2つの標本の分散比を区間推定することもできますが,授業では省略しました.
F分布を利用した2つの標本の分散に差があるのかを検定できます.この手法はこれから学ぶ分散分析の基礎となります.

6.F検定

帰無仮説: 分離比は9:3:3:1である.
対立仮説: 分離は9:3:3:1ではない.
例として,メンデル遺伝で分離の法則に従ったデータが得られたかを検定してみよう.
帰無仮説が成り立つと仮定したときに今回のデータが得られる確率P値はエクセルの関数から,以下のように計算できます.
したがって,有意水準5%で帰無仮説は棄却できず,分離比は3:1でないという有意な証拠はありません.つまり分離比は3:1であると考えてよいことになります.
カイ二乗分布を用いた母分散の区間推定(例題とエクセルによる計算)

1遺伝子座の場合

 自由度が1の場合(メンデル遺伝の分離比では1つの遺伝子座しか考えないとき)は,χの値がやや高めに算出されるため以下のように補正します.