データの整理

1.100個以上のデータを5品種のトマトの着果数について調べました(品種は仮想のもの).データをまったく整理しなければ以下のようになります.これではどの品種が着果数が多いのかすらぱっとみてもわかりません.

4.ヒストグラムを書くと,度数分布表よりそれぞれの品種の着果数の特徴がわかります.グラフにすることで一目で情報を示せます.その代わり,細かな数値は読み取れませんので,必要に応じてグラフにしたり,表にしたりします.

戻る

代表値にもいろいろあります.下にはいろいろな代表値を示しました.このうち中心的傾向を示す代表値である平均,メジアン,モードとばらつきを示す代表値である分散,標準偏差などを授業では取り上げました.平均という1つの代表値だけで品種の違いがわかります.データを要約して分かりやすくすることが重要であることがわかります.

5品種を比較するために、同じグラフ上に書いてみます。
この場合、2番目のグラフのように折れ線グラフの方が見やすいかもしれません。

3.どの範囲のデータがいくつあるかを調べ,度数分布を書きました.これをみると大きさで並べるよりもどの品種が着果数が多そうなのか,あるいは着果数のばらつきが大きいのかがよりはっきりわかります.

2.まず大きさの順に並べます.こうするとデータの特徴がわかってきます.しかし,これだと情報量がおおすぎで,端的にどうかというのは難しいです.