分散について

n個のデータを持つある集団の平均値を μ とした場合、偏差は各個別のデータがその平均値からどれだけ離れているのかを示している。
つまり、n個のデータがある集団なら、偏差もまたn個存在する。
n個あるデータの代表値を計算したくなるのは、たぶん自然なことで、
この偏差の二乗の平均値を分散という。
ちなみに、偏差の総和はつねに0である。

ある母集団の平均値がμであれば、その母集団からサンプリングした標本集団の平均値も基本μとなる。
ただし、分散は一致しない。この場合、大きさmのサンプリングを行えば、標本の分散はσ^2/mとなる。