分散分析とは何か?(データの変動からいかにして誤差と処理による変動に分けるか?)

実験計画学のトップページへ戻る

トップ アイコン
トップページヘもどる

例:ハムスターをひまわり,大豆,人工餌の3種類のどれで育てるのがいちばんよいかを実験した.
以下の解析は「実験計画と分散分析のはなし」大村平著日科技連を参考にしました.
2.実験結果にまったく誤差が存在しないで,餌の効果だけが現れたらどうなるでしょうか?
餌の効果さえなければ,誤差もないなら,すべてのデータは同じになります.ほっといても15g体重が5匹それぞれ均等に増えました.
餌の効果を右のようにしました.すなわちひまわりは効果0,大豆は-3,人工餌は+3の効果がありました.ここではあとの計算が楽なように効果の合計が0になるように効果の大きさを決めておきます.
1.与えられたデータから誤差と処理による変動を分ける前に,誤差も処理による変動もわかっているとしてデータがどのように構成されるかを考えましょう.つまり逆から考えてみます.
餌の効果を足せば,右のようになります.誤差がないなら,実験すると右のように各処理列のそれぞれのデータはみないっしょになるはずです.
ところがデータには誤差がつきものです.誤差は何の規則性もなくデータにつきまといます.(なお規則性のある誤差:系統誤差があると今やっている議論はちょっと困ることになります.だから分散分析を利用する実験計画ではいかに系統誤差を小さくするかが大事になります.系統誤差についてはのちのち取り上げます.)
例えば,誤差が右のように個々のデータにつきまとったとしましょう.
 誤差を足して,実際の実験で得られたデータは右のようになりました.さて平均すれば確かに人工餌がよく,餌の効果がありそうですが,データの誤差から考えて,このような処理間の違いは偶然に起こったというには珍しいことといえるのでしょうか?
 誤差の大きさと処理の大きさを比較するためにはこの両者を右上のデータから分けなければいけません.
 データの平均は15これを列の平均から引きます.これがデータから見積もられた列の効果(処理の効果)といえます.誤差のせいでちょっと値は変わりましたが,本当の効果に割合近い値といえそうです.
 実験結果から見積もられた列の平均を引くと誤差が見積もれます.
すなわち誤差=データ−全体の平均−列(処理)の効果
です.
以上のようにして,実験結果から誤差と処理の効果を分離しました.その結果は右の通りです.真の処理の効果,誤差と多少は違いますが,それほどはずれてはいないようです.
3.誤差がデータにランダムに混ざるとどうなるでしょうか?
4.得られたデータから誤差と処理の効果を分けましょう
5.分散分析を行います.
分散分析での帰無仮説は効果による変動と誤差による変動には差がないということです.これは言い換えると
μ=μ=μ=μ=・・・・ということになります.処理の母平均がすべて同じということです.
図で表すと下のようになります.
対立仮説は水準間の母平均はどれか一つは異なるということです.すなわち処理には効果があると言い換えられます.図では以下のような図が対立仮説の一例となります.
6.分散比を計算し,F検定します.分散比の計算はわかりにくいとおもいます.自由度という概念がなかなかわかりづらいからです.帰無仮説が成り立つとした場合に,この分散比が得られる確率がP値となります.
式をみるとわかるように,処理の効果が大きければ,Vは大きくなり,F値は大きくなります.F値が十分に大きければ,帰無仮説が成り立つと考えるより成り立たないと考える方が自然だということになります.
効果には0.6,-3.2,2.6の3つしかなく,しかもこれらを作り出すために全体の平均を使っているので,自由度はφ=3−1=2となります.

したがって,右の表のように効果の分散を計算でき,
V1=41.3
であることがわかりました.
誤差のデータは15個ある.使用した平均は各列にあるので,15.6,11.8,17.6の3つであり,自由度は
φ=15−3=12となります.

したがって,右の表のように誤差の分散を計算でき,
V2=5.43
であることがわかりました.
7.P値を求めます.
このようなF値が得られる確率P値を計算すると,
0.006229であることから(片側検定)

有意水準1%で帰無仮説は棄却されます.
処理と誤差のばらつきには有意水準1%で有意な差があります.
すなわちハムスターの成長は餌によって変化すると結論できます.