標準偏差に2種類の数式があって、つまりnで割る式と n-1で割る式であるが
その数式と用途の違いを その1で 次に名前の混乱を その2で説明した。
ここではこれまでの 2つの標準偏差に関係する補足を記載する。
5回しかやっていない実験を 10回やったと言ってはいけない理由
標準偏差と不偏標準偏差を正しく理解出来たら、
「抽出率を半分にしたから、値を2回(づつ)数える」という行為が、統計における推定値(結果)に影響することは容易にわかり、
そのようなことをしてはいけないことが明確に理由付けられるだろう。
つまり、5回しか実験していないのに10回実験したことにして統計値を出せば、
標準偏差の数式の分母 nは5から10に変わるが、平均値との差の2乗の和の値も2倍になるので、
標準偏差の値は変わらない。
しかし両者ともに、不偏標準偏差を使うべき状況にあるから、分子は2倍となるのに対して、
分母は4および9となり(自由度から1を引くため)、つまり8で割るより9で割った方が小さな値を導き出すことになる。
2回数えるという行為は見かけのブレを小さくできるのだ。
しかし。その代償は、推定された平均値が真の値から外れている可能性を高めている。
つまり本質的には、結果の精度を悪くしているのだ。
統計学のWebサイトの評
このような現状で、統計学をWebサイトから吸収する場合、標準偏差と不偏標準偏差を区別しているWebページ、 あるいは区別している同一執筆者のWebページに頼ることをお勧めしたい。
そうした観点から、“我楽多頓珍館”の 玄関>雑学の部屋>雑学コーナー> 統計学入門 は、手作り感満載であるが、しっかりとした記述となっている。
また、大人のための統計学教室(なごみ)も
(私が見た限りにおいて)しっかり記述されている。(なにせ大部である)
しかし、ここでは不偏標準偏差を “母集団から抽出された標本を元に推定される標準偏差 s は次の式から求められます。”
(18-5. 標準偏差と標準誤差のページ) と冠をつけて、
限定的に記述されているので誤りではないが、せっかくその直前に不偏分散を紹介し、
分散と式が異なることを紹介しているのだから、せめて s の後に「これを不偏標準偏差という」とし、さらに下方の「まず、標準偏差を計算すると」 を
「まず、不偏標準偏差を計算すると」にして欲しかった。
もっとも“なごみ”では、不偏標準偏差という用語(概念)より、(最終的な)標準誤差の導入を図りたいようだ。
同時に、”不毛な”用語論争を避けたい意図も感じ取られる。