参考資料
統計とは「ある条件に基づいた集団について調べた結果を集計加工して得られた数値」である。
例として、課題11-12 では、あるテストの点数が用いられている。
テスト結果の点数データそのものでは、その受験者集団の習熟度、ばらつき具合いは
わからないが、統計処理を行うことにより傾向をつかむことができる。
- 平均値
- 各データの和をデータ数で割ったもの。受験者集団のテスト結果を代表する値である。
平均値:
- 分散
- 各データの平均値からのずれの二乗和をデータ数で割ったもの。
分散:
- 標準偏差
- 分散の平方根。データのばらつき具合いを示す指標。分散は次元が異なるために
平方根を取った標準偏差を用いることが多い。
標準偏差:
- 偏差値
- データのばらつき具合いを標準化し、各データの全体中の位置を表わす指標。
したがって、偏差値の平均値は50となり、標準偏差は10となる。
偏差値:
全集団をについて調べることが不可能な場合や意味がない場合、その集団から
いくつかについて代表して調べ、その結果を元に元の集団(母集団という)に
ついての統計量について推計を行う。例としては、工場出荷製品の製品寿命などがある。
この場合、母集団の統計量は実際には得られないが、統計/推計学の結果を用いると
標本のデータから次の式によって推定できる。
- 平均値
- 標本データの平均値と一致すると推定される。すなわち
平均値:
- 母分散
- 各データの平均値からのずれの二乗和を自由度で割ったもの。ばらつき具合いを示す。
母集団の平均値は得られないため、標本の平均値で代用する。そのため、n 個のデータのうち
1個は平均値と残りのデータから求めることができるので自由度は (n-1) となる。
母分散:
- 母標準偏差
- 母分散の平方根。母集団のばらつき具合いを示す指標。
母標準偏差:
- 偏差値
- 母集団における、各データの位置を推定する指標として用いる場合は、次式を用いる。
偏差値:
tacha@tack.fukui-med.ac.jp
$Id: 04.html,v 1.1 2003/05/09 05:39:45 tacha Exp tacha $