無作為抽出しない,偏った標本でどんな間違いをするか?

 わたしたちは母集団の性質をしるために,その一部を取り出した標本から統計量を求め,母集団の性質(母数)を推定します.まず次の例をみて,母集団は何か,標本は何かを考えてみましょう.
例:あるテレビ局のある番組の視聴率について中国地方の20歳代の男女300人を対象に調査した.
 この場合は,実際に調査対象となった300人が標本,母集団は現在の中国地方の20歳代の男女全員となります.この標本が無作為抽出ならば,中国地方の20歳代の男女が数十万人あるいは数百万人いても,統計的に推測ができます.
 母集団と標本がどれかについて,次の例を考えてみましょう.
例:肉質のよくなる可能性のある薬Aを 3歳のアンガス種の雄牛5頭に与え,肉質を調べた.
 この場合,母集団はいま現在,3歳のアンガス種の雄牛すべてという見方ももちろん間違いではありませんが,こういう研究では,将来3歳になる子牛,さらにこれから生まれる予定の牛などみな含めて母集団にするのがふつうです.このような仮説的無限母集団の場合,研究の目的によってはアンガス種だけでなく,ほかの品種の牛,あるいはときには牛に近い動物,例えば反芻動物すべても母集団に入れて考えることもあるかもしれません.どこまでを母集団としてよいのかは,研究内容によります.
 しかし,このような仮説的無限母集団でも標本は無作為抽出されたものでなければなりません.そうはいっても未来の牛を抽出できませんから,無作為抽出したとみなせる標本である必要があります.もし標本がかたよったものなら間違った結果を生みます.
まちがった標本の例をあげます.
例:となりの老人は85歳です.いつもこういいます.「わたしは80歳過ぎても元気だ.足腰もぴんぴんしている.毎日,たばこを1箱以上吸うからだ.たばこは長寿の秘訣だ.」
むちゃくちゃな論理ですが,こういう理屈を述べる人はどこかにいるかもしれません.この人の頭の中では母集団は何で,標本は何でしょうか?そして,ほんとうは母集団は何で,標本は何でしょうか?そしてこの標本は無作為に抽出されたものでしょうか?

戻る

 この老人の頭の中の母集団は人類すべて,それもこれから生まれてくる人類も含めたすべてなのでしょう.標本はこの老人だけです.でも実際の母集団はこの老人だけで,標本はこの老人だけなのではないかと考えられます.この老人は人類すべてから無作為抽出された標本とはいえません.母集団がこの老人だけなら,偏ってはいないでしょうが,この母集団と異なる他の母集団(人類すべて)に老人の論理は当然適用できません.
 さて,以上の例では,まだ偏った標本がいかに困った結論を出すか,十分にはわからないかもしれません.次の例について考えてみましょう.
 例:50人の男の老人が集結しました.彼らはみなこういいます.「わたしたちはみな80歳以上だ.毎日たばこを1箱以上吸っている.みな元気で,足腰もぴんぴんしている.妻はみなタバコを吸わないが,三食いっしょに食べている.副流煙をたくさん吸うので,妻はみな80歳以上で,元気でぴんぴんしている.たばこは主流煙のみならず副流煙も健康によいのだ.50人もそういうのだからまちがいない.禁煙運動を粉砕しましょう.
 さて,母集団,標本は何か考えましょう.
 以上のことから,標本は無作為抽出されたものでなければならないこと,偏った標本をいくらたくさん集めたところで,正しい結論には到達しないことがわかります.それどころか偏った標本をたくさん集めて,その結論を一般化してしまうことがいかに多いかということを考えさせられます.
 無作為抽出された標本ならば2つや3つしかなくても,なんらかの統計的な推測ができます.しかし,偏った標本は多ければ多いほど,間違った結論をより強く確信させるのみです.