【スプレッドシート】STDEV|データ標準偏差をもとめる


STDEVは、標準偏差(standard deviation)

平均点から何点以内に受験者の多くが収まるかを求める関数よ。その何点が大きい程、点のばらつきが激しいテストだったと考えられるわ。

60点が平均のテストで、30点取ったときの気持ち?
う、うん。その平均点からの差分(-30)を偏差っていうんだけど…これは標準偏差とは違うの。次の例をみてくれる?



 ある試験結果1

 平均は? (40+45+60+75+80)÷ 5=60

 平均との差(偏差)の平均は? (20+15+0+15+20) ÷ 5=14

※ 偏差を便宜上絶対値表示にしています。


 ある試験結果2

 平均は? (35+50+60+70+85)÷ 5=60

 偏差平均は? (25+10+0+10+25) ÷ 5=14

 ある試験結果3

 平均は? (30+55+60+65+90)÷ 5=60

 偏差平均は? (30+5+0+5+30) ÷ 5=14


どの試験が差が大きいテストだったと思う?
それは最後でしょ…
でも、平均点も偏差平均も上の3つは答えが一緒になって参考にならないの。
その直感を「データのばらつき方の大きさ」として数値にするのが標準偏差よ。


Step # 1:標準偏差の求め方


標準偏差は、平均からの差(偏差)を2乗して、大きな差程強調してから平均するの。



 試験結果1の標準偏差

※ 平均は60、偏差平均は(20+15+0+15+20) ÷ 5=14 でした。


1では、差を強調するために、偏差を2乗してから平均を出します。
2では、1の答えが大きすぎるので、平方根で数字を2乗前の小さなものに。


 標準偏差は? 17.7点 (受験者の大半が平均点から17.7点以内にいる。)



 試験結果2の標準偏差

※ 平均は60、偏差平均は(25+10+0+10+25) ÷ 5=14 でした。


1では、差を強調するために、偏差を2乗してから平均を出します。
2では、1の答えが大きすぎるので、平方根で数字を2乗前の小さなものに。


 標準偏差は? 19点 (受験者の大半が平均点から19点以内にいる。)



 試験結果3の標準偏差

※ 平均は60、偏差平均は(30+5+0+5+30) ÷ 5=14 でした。


1では、差を強調するために、偏差を2乗してから平均を出します。
2では、1の答えが大きすぎるので、平方根で数字を2乗前の小さなものに。


 標準偏差は? 21.5点 (受験者の大半が平均点から21.5点以内にいる。)


たしかに点数に差があるテスト程標準偏差が高くなってるけど、平均の21.5点以内にAさんとBさん入ってないよ…
大半の受験者が、って言い方をしていたのはこのせいで、実は全体の約68%を意味するの。「平均値±標準偏差」に全体の約7割が含まれることを統計的に「68%ルール」と言って、これは広く自然界で認められた現象なのよ。
じゃあ絶対ではないけど、データのばらつき具合を直感的に把握できる数字ってこと?
その通り。もし余りに標準偏差が大きければ、データとしてはサンプルのばらつきが多く、信頼できないかもと考えることもできるわ。今回の例では5人のテストの点扱ったけど、実際はもっとサンプル数も外れ値も多いデータを使うことがあるでしょう?標準偏差が統計資料に多く添付されるのは、ある程度直感的にデータの振り幅を読者に伝えるためね。

標準偏差の使い道
例えば、あなたがお弁当屋さんだとします。一日平均60個が売れ、標準偏差が8だとしたら……売れない日では平均52個、調子のいい日には68個が出る。この予測が立てられることで、ロスの少ない経営ができますね。