BioWiki

標準偏差

同じ測定を繰り返し、そのデータの分布をプロットすると、多くの場合正規分布曲線に従う。この分布曲線は、中心となる中心値と分布の大きさ(カーブの幅広さ)の2つのパラメータで定義される。 この分布が幅広ければ値のばらつきが大きく、狭ければばらつきが小さい。このバラつきの程度を数値化したものが標準偏差(standard deviation)と呼ばれる。

定義

ばらつきの程度を数値化するためは、測定値と平均値の差をとっていけばいいが、単純算術平均をそのままとると、正負の符号で値がキャンセルされてしまう。そこで、測定値と平均値の差の二乗(偏差平方和)をもとめ、その総和を得る。この総和をデータ数で割ることによって、分散が得られる。

分散 (m:平均値)

<m>sigma^2~=~sum{}{n}{(x_i-m)^2}/n</m>

この分散の平方根をとることによって、数値の単位を元に戻したものが標準偏差

標準偏差 (m:平均値)

<m>sigma~=~sqrt{sum{}{n}{(x_i-m)^2}/n}</m>

A
1 109
2 98
3 140
4 192

<m 12>SD~=~sqrt{(109-134.75)^2+(98-134.75)^2+(140-134.75)^2+(192-134.75)^2}/4~=~36.46</m>

Excelで計算するには、データを母集団とみなす場合はSTDEVP、データを確率標本とみなす場合はSTDEV関数を使います。

  • データを母集団とみなす : 別のセルに=STDEVP(A1:A4)と入力
  • データを確率標本とみなす: 別のセルに=STDEV(A1:A4)と入力

リンク