バナー 老科学者の繰り言 論理と科学を語る

トップ 数値の表現 科学と論理 科学の周辺 番 外 プロフィール




2種類の標準偏差  続き

前のページ には2種類の標準偏差の数式を掲載しています。

なぜこのように意味が違い、使用目的も違うのに、同じ名前を使用しているのか、原因について考える。

第一に、統計学において不偏性の概念があまり浸透していなので、各ページの執筆者が、自分が取得した標準偏差を(唯一の)標準偏差だと思い込んでいる点にある。

また、用途が違うために、この2つの標準偏差を比較して記述されることが少ない。 つまり、統計学を目的別に記述する流れに沿って登場するために、”離れた”場所で出現することが考えられる。

ちなみにGoogleで検索した時、標準偏差 約 14,500,000 件 不偏標準偏差 約 95,500 件と 著しく“偏る”(かたよる)事実が示している。
ただし、2つの標準偏差を ”別の用語” で使い分けている人もいることにも起因している。
例えば 『一口メモ』インデックスの該当ページでは 母標準偏差標本標準偏差(=不偏標準偏差)として区別している。

抽出を伴う統計では、母集団標本は明確に区別され、対比的である。
それに対して、集計レベルの解析、たとえば毎月の家計簿とか、クラスの試験成績の分布を調べるときのように全データが得られているような場合は  母集団=標本なのである。(不偏性の概念は不要)。
そうした統計学初級者に、母だとか標本だとか、はたまたExcel関数での表示に使われている英語のsampleとかpopulationの選択を迫ることが問題なのではなかろうか。
また、標本sampleという言葉自身にも問題がありそうだ。標本とは何か?ということである。

私は不偏性の概念を持ってはいるが、私にとって標準偏差の式はただ1つ、 前ページの左、つまりnで割った形の式だけだ。
その上で、推定・検定用には自由度 (サンプル数に相当)から 1を引く というように学習・記憶してきた。
不偏標準偏差という用語はあまり用いてこなかった。
では自由度とは何か? それはまた次に機会に紹介しよう

補; Wikipediaによると 標準偏差・不偏標準偏差の用語については、 専門家でも意見が異なるようで、もっと根が深いのかもしれない。


2つの標準偏差に関する補足を 次ページで紹介する。