第1回 実験計画学とは?
宿題 下線のある文字をクリックすると答えあるいは見本・例が出ます.
1.エクセルでの基本的な計算方法
  対数,指数などの計算をエクセルでできるようになっておきましょう.
A. 基本的な計算(角度の単位はラジアンです) 
B. 統計の計算でよく出てくるもの
トップページへ
以上の計算のエクセルによる計算方法を示しておきます.下のボタンをクリックしてください.
 とりわけ農学,生物学,医学の対象とする生物を扱うとき,その測定量は大きなばらつきがあります.そのうえにたくさんのデータを集めるのがたいへんです.
例1:犬の体重
犬の体重の平均はいくらでしょうか.自分の家の犬の体重が平均であるとはいえないでしょう.では何匹の犬をどのようにしてはかったら,犬の平均体重を推定できるでしょうか.
例2:猫のエイズの治療薬
日本の猫の12%が猫のエイズ(FIV)に感染しており,特別天然記念物のツシマヤマネコでは22%の感染率である*.このような猫のエイズの治療薬として,A,B,Cの3つを開発したとする.3匹の猫に3種類の薬を与える実験をして,それでこの薬は効きますと判断してよいのか.*猫のエイズについては集英社新書:猫のエイズ(石田卓夫著)に詳しい.
実験計画学のメリットは大きく3つあります.
1.実験回数を少なくできる.
2.精度がよくなる.あるいは精度がわかる.
3.実験データの変動を解析できる.
さて,生物について何かをいおうとするとデータがばらつくためにかなりの数を調べないといけないということになります.しかし,たくさんのデータを取ればよいというわけにはいきません.いくつかの問題点があります.
1.いくつサンプルをとればどのくらいの精度なのか.
犬の体重を何匹調べたらよいのか?その基準はあるのでしょうか.
2.どのようにサンプルを取ったらよいのか.
犬といってもいろんな種類があります.それに食生活が豊かな日本の犬だけを犬の代表にしてよいのでしょうか.猫のエイズの治療薬にしても発病してどのくらいたった猫かで薬の効果が違うでしょう.ひょっとしてAは発病直後にはよく効き,Cは末期症状を緩和するという効果があるのかもしれません.
3.たくさんのサンプルを取ること自体が難しい.
数を増やせば増やすほど,労力,時間,費用がかかります.実験の規模が大きくなると,実験を均一に行うことが難しくなります.動物実験ではあまりにたくさんの動物を使うことは倫理的な問題も関わってくるでしょう.
総和
標準偏差
二乗和
平均
データ: 108, 109, 115, 116, 117, 118, 120, 124, 125, 127
C. 以下のデータについて総和,平均,二乗和,標準偏差を求める.
平方和 SS (12+22+32+42+52)-(1+2+3+4+5)2/5
二乗和 232+352+542+102+52+952=
平均 m (23+56+85+94+52+120+21)/7=
総和 Σ 1+2+3+4+5+6+7+8+9+10=
 データの精度を見積もり,その上でいかに少ない実験回数あるいはサンプルで精度よくデータを得るかが大事になります.そのような方法を提供するのが統計学の1分野である実験計画学です.
sin 50=
cos 60=
log10200=
ln 35=
(2.65×108)×(3.84×105)=
√5=
3.45=
2.652=
2. 大数の法則を当てはめることのできるくらいのデータを集める.最低でも100以上のデータを集める.
例:
  1. 100以上のデータを集め,大きい順に並べる.
  2. 次の値を見つけだす,あるいは計算する. 最大値,最小値,レンジ,平均,メジアン
  3. 最大値と最小値の間を5,10,15に分級して度数分布を調べる.
以下,エクセルを用いて1000個のデータを解析した例を示しました(ボタンを押してください).
実験計画学のトップページへ戻る

トップ アイコン
トップページヘもどる

1.大数の法則
 科学の始まりがいつからかは特定することはできないと思いますが,科学というものが形作られる上で特に取り上げなければならない発見にケプラーの法則をあげることができるでしょう.
 ケプラー(1571-1630)の法則はブラーエ(1546-1601)による膨大かつ精密な天体観測記録から導き出されました.ブラーエの観測記録から火星の軌道をケプラーは長い年月をかけて導き出しました.ケプラーの法則は以下の3つです.
1.惑星は太陽を焦点の1つとする楕円軌道上を動く.
2.惑星が一定時間に動径が描く面積は一定である(面積速度一定の法則).
3.惑星の公転周期の2乗は楕円軌道長径の3乗に比例する.
 惑星という漢字からイメージするところは,惑星というのは何らかの規則のある運動はしないように思えます.惑星は英語ではplanetですが,これも古代ギリシャ語を語源とし,その意味はさまよう(星)だそうです.昔の人は,惑星の動きに規則性を見いだせなかったということです.
 しかし,たくさんのデータを集めて,解析すれば,少数の規則を発見できることがわかります.これが科学の黎明であったといえるでしょう.ケプラーの法則はさらにニュートンの万有引力の法則につながります.
 それ以前の人間(というよりは現代の人間でも大して変わりませんが)はごくわずかの経験で物事を決めてしまっていました.「柳の下のどじょう」のような話は今でもいくらでも聞くことができるでしょう.しかし,せいぜい2,3回の経験で物事を決めてしまうとあとでたいへんな過ちをおかすことは珍しくありません.農業の世界でも,1,2回の成功で,これでうまくいくと断言して,あとで災難を招いた例はいくらでも探せるでしょう.
 数多くデータを集めるとより正しい結論が得られるようになります.このようなことを述べた法則の一つに大数の法則があります.データをたくさん集めれば,集めるほど,そのデータの平均値は真の平均値に近づくという法則です.
 さて,たくさんデータを集めれば,たくさんの規則性が得られるのならいいが,たくさん集めて,1つ2つの規則しか得られないなら大損だ・・・という人もいるでしょう.しかし,ケプラーの法則から導かれたニュートンの万有引力の法則から1846年に海王星が発見されました.海王星は1781年にハーシェルが発見した天王星の軌道がニュートンの万有引力の法則から計算されたものとずれていることから,その存在が予言され,その予言したほぼ近くに発見されたのです.
 このように多数のデータから得た少数の規則は,むしろ新しい発見を導いたのです.さて,こういう自然科学だけでなく,人の寿命などでもたくさんのデータを集めれば規則性を導くことができます.特定の個人はいつ死ぬかわかりませんが,寿命に関するデータを集めて作られた生命表を見れば,日本人の男女がどんな割合で何歳まで生きられるかわかります.これを使って,生命保険などの掛け金が決まっていますし,年金などの社会福祉政策も決められます.また,個々人にしても,自分がいつ死ぬか明確にはわからなくても,だいたいいつぐらいまで生きられそうかはわかります.それをもとに人生設計していくわけです.(しない人の方が多いとは思いますが.)
 このことから多数のデータを集めて規則性を得ることの意味がわかります.またいくら多数の数値を集めてもいい加減な数値(データとは呼べない)であれば,きちんとした規則性がでません.そんないい加減な数値から出た規則からはまともな政策もでないし,保険会社もつぶれてしまうでしょう.
2.でも少数のデータで何かをいいたい・・・
しかし,そうはいっても人間は誰しもけちですから,1,2回の経験で結論したがるものです.また,大数の法則にかなうだけのデータを集めるのが困難だったり,不可能だったりするものもあります.
1.自動車の耐久性テスト たくさんやればお金がかかりすぎる
2.オオサンショウウオの生態 そんなにたくさんいない
3.猫のエイズの治療薬 効くか効かないかわからない薬(それも劇物)をたくさんの猫に与えれば動物虐待といわれるかもしれない
などです.
統計学は少数の標本であっても,その標本が母集団から無作為(ランダム)に抽出されたものであれば,その数が少なくても,ある程度の精度で結論できることを保証します.ここで大事なのは,自分の知りたい対象(母集団)から無作為に調査対象を抽出することです.少なくても無作為に選んだ標本の方が,数がいくらあろうと無作為でない標本よりははるかにまともな結論が出せるのです.
 次に少ない実験でもできるだけの情報を取り出したいと考えます.
 農学実験ではいくつかの要因(気温,湿度,肥料,品種など)について同時にいろいろに変えて実験したいことがよくあります.気温2つ,湿度2つ,肥料2つ,品種2つとしただけでも16種類の組み合わせになります.こんなにたくさんの実験をやるのはたいへんです.こういう場合に上手に組み合わせて,データを解析してやれば実験を減らせます.実験計画学では実験回数を抑えながら,データの精度を高め,得られたデータからできるだけ多くの情報を得るためにはどのように実験を計画,組み立てればよいか,得られたデータをどう解析するかなどを学びます.
 注意)ときどき実験が終わってからどうやってデータを解析したらいいのですかと聞きに来るのですが,実験を計画する段階ですでにデータの解析方法を考えておくのが正しいのです.だから実験計画学なのですね.
度数分布を作るときに,階級の境界値はキリのいい値にしましょう.データによっては10や15に分級できないことがあります.その場合は,分級できる最大数で分級してください.
度数分布とヒストグラムにおける階級と階級間隔の決め方
度数分布において階級数を10以上得られない場合
度数分布の階級の区切り方
エクセルにおける度数分布表とヒストグラムの書き方
国立科学博物館の天王星・海王星の所に写真があります
厚生労働省のサイトから:平均余命(2004年),平均寿命の推移
厚生労働省のサイトから:平均寿命の国際比較
厚生労働省のサイトから:死因分析
厚生労働省のサイトから:平成16年度簡易生命表(男)
厚生労働省のサイトから:平成16年度簡易生命表(女)

例えば,自動車保険は20歳代の若者には高い掛け金が設定されています.それに対して,若者の方が反射神経も鋭く,運転ミスも少ないはず,なのに事故が多いはずの老人は掛け金が値上がりしないのに若者ばかり高い掛け金をとるのはおかしいという意見もあります.下の警察庁の交通事故調査をみてほんとのところはどうなのか,調べてみましょう

警察庁のサイトから:平成17年中の交通事故の発生状況について(PDF)

最近は20歳代の事故は減少傾向にあり,一方,30歳代の事故が増加しているようです.ただ上のPDFのP23にあるように免許を持つ人について事故の割合を調べると若者の事故率の高さが際だちます.やっぱり保険料は高く設定されるのが合理的なのかもしれません.