2種類の標準偏差 続き
前のページ には2種類の標準偏差の数式を掲載しています。
なぜこのように意味が違い、使用目的も違うのに、同じ名前を使用しているのか、原因について考える。
第一に、統計学において不偏性の概念があまり浸透していなので、各ページの執筆者が、自分が取得した標準偏差を(唯一の)標準偏差だと思い込んでいる点にある。
また、用途が違うために、この2つの標準偏差を比較して記述されることが少ない。 つまり、統計学を目的別に記述する流れに沿って登場するために、”離れた”場所で出現することが考えられる。
ちなみにGoogleで検索した時、標準偏差 約 14,500,000 件 不偏標準偏差 約 95,500 件と
著しく“偏る”(かたよる)事実が示している。
ただし、2つの標準偏差を ”別の用語” で使い分けている人もいることにも起因している。
例えば 『一口メモ』インデックスの該当ページでは 母標準偏差と標本標準偏差(=不偏標準偏差)として区別している。
抽出を伴う統計では、母集団と標本は明確に区別され、対比的である。
それに対して、集計レベルの解析、たとえば毎月の家計簿とか、クラスの試験成績の分布を調べるときのように全データが得られているような場合は
母集団=標本なのである。(不偏性の概念は不要)。
そうした統計学初級者に、母だとか標本だとか、はたまたExcel関数での表示に使われている英語のsampleとかpopulationの選択を迫ることが問題なのではなかろうか。
また、標本sampleという言葉自身にも問題がありそうだ。標本とは何か?ということである。
私は不偏性の概念を持ってはいるが、私にとって標準偏差の式はただ1つ、
前ページの左、つまりnで割った形の式だけだ。
その上で、推定・検定用には自由度 (サンプル数に相当)から 1を引く というように学習・記憶してきた。
不偏標準偏差という用語はあまり用いてこなかった。
では自由度とは何か? それはまた次に機会に紹介しよう
補; Wikipediaによると 標準偏差・不偏標準偏差の用語については、 専門家でも意見が異なるようで、もっと根が深いのかもしれない。
2つの標準偏差に関する補足を 次ページで紹介する。