バナー 老科学者の繰り言 論理と科学を語る

トップ 数値の表現 科学と論理 科学の周辺 番 外 プロフィール




毎月勤労統計調査の統計学

 

回収率

回収率についてはなじみがあり、多くの人が容易に理解できるだろうと思う。
様々な報道機関が行う“世論調査”では次のような記述が付記されるのが普通である。たとえば、有権者3000人にアンケートを行い、2100人から回答を得た。 あるいは、有効回答率70%であったという記述でも良い。有効回答者数をすぐに計算できる。そして、たとえばある質問事項に対して賛成60%、反対40%であったと。 そうすると読者は1260人が賛成し、840人が反対したのだと容易に理解できる。もし、有効回答者数あるいは有効回答率が与えられなければ、1800人が賛成し、1200人が反対したのだと 誤解するかもしれない。有効回答率は、その世論調査の実際の規模を通じて読者に調査の精度を理解させる重要な指標となっている。 この“有効”という用語をこのように理解すれば問題はないが、その点を特に強調するために、このページでは “計算実算入” (数または率) という用語を特に用いたい。 分析に実際使用した数のことである。回答を得たが、その内容に不備があって分析に使用できなかったという回答(欠落データ、欠陥データと呼ばれる)もさらに排除した厳格な有効回答数である。 英語でも様々に表現されている。 “recovery rates” “response rates” “effective rates” “valid rates”  ここでは“valid rates”の訳として、くどい表現ではあるが、“計算実算入”(数または率)としておく。

抽出率と抽出比率

毎勤統計調査では、 (以下 厚生省のページから引用)
結果推計方法
ア 推計比率
 推計比率は、本月分の推計に用いる前月末母集団労働者数と、本月分の調査事業所の前月末調査労働者数の合計の比率のことで、産業、規模別に次式によって定めます。
r=E/e0
r;推計比率(産業,規模別)
E;前月末母集団労働者数(産業,規模別)
e0;前月末調査労働者数の合計(産業,規模別)
 前月末推計労働者数は,前月末調査労働者数の合計e0に推計比率r(=E/e0)を乗じたものであるから、使用した前月末母集団労働者数Eと等しくなります。
 前月末母集団労働者数Eとして用いる値は、前月分調査の本月末推計労働者数に(2)で述べる補正を施したものです。ただし、最新の経済センサス結果が判明したときには、 それから作成した値(ベンチマーク(benchmark)という)を前月末母集団労働者数とします。このような推計方法は、リンク・リラティブ法(link-relative method)といわれるものです。
以上 引用終
毎勤で”推計比率”として定義されているのは“抽出率の逆数”である。そのことを念頭に抽出率を考えてみる。

抽出率としていくつかの式を考えることができる。以下、ブラウザの幅によって数式が乱れる可能性があるため、各式の 分母 分子 の形で記述する。

まず、マスター表からランダム抽選で(あるいは別の方法で)選別した段階での抽出率で、回答率は一切考慮していない式

式① 分子 マスター表の当該層において抽出した事業所数
   分母 マスター表の当該層における 全事業所数
なお式①では、事業所数を労働者数に置き換えても全く同じことになる。

次に、回答率を考慮するが、事業所数に着目するか、労働者数に着目するかによって2つの式が考えられる。

式② 分子 マスター表の当該層において 計算実算入した事業所数
   分母 マスター表の当該層における 全事業所数

式③ 分子 当該層において 計算実算入した事業所の マスター表記載の労働者数の和
   分母 マスター表の当該層における全事業所の マスター表記載の労働者数の和

一方、毎勤調査が事業所を通じて労働者の実態を推定するものであるとの立場から、労働者数を基礎とする抽出率が考えられる。

式④ 分子 当該層において 計算実算入した労働者数の和
   分母 マスター表の当該層における 労働者数の和

式⑤ 分子 当該層において 計算実算入した労働者数
   分母 当該層の 全国労働者数

これらの内、式⑤が最も理想的である。しかし、この式⑤は“根源的不可能”“絶対的不可能”である。なぜならば、式⑤の分母を求めることが目的であり、 その目的の数値を含む数式を計算途中に使用することはありえないからだ。したがって、代替法を取らざるを得ないという点が重要である。式④が代替法としては次善の式である。 そして、マスター表の更新時に一度 式④で校正した後は、分母に“前月の当該層における 労働者数の和”と置換した式④で代替できる。

実際、厚生省の説明における抽出(比)率は、上記記載の 式➃と 本質的に同じである。

なお、式の説明で、当該層とは 産業・規模別の層のこと、また“全国”には “5人以上の”が付随することを付記する。

抽出率を規定し、抽出率の逆数を乗じることは 分母の数字に戻ることを意味する

このページで最も重要な点は、いずれかの数式によって”抽出率”を規定し、抽出率の逆数を乗じるということは、分母の数字に戻るという点を理解することである。これは 数学を理解できれば明瞭なことである。

ただし、若干の補正が加わる。上記の、厚労省説明引用部分の“(2)で述べる補正を”が加わる。余分な事かもしれないが、この(2)は(3)の誤りである。私が気付いた1月始めから 本ページをアップした時まで、誤りのまま放置されている。毎勤統計調査があれだけ過熱したにもかかわらず、この小さなミスに気付かない当局、さらには指摘する人もいない事実は、 まじめに統計を考えている人は皆無なのだろうと憂える。余分な事 終。 厚生省ページの(3)に記載されているように、調査事業所における新規採用者あるいは離職者などによる労働者数の増減を織り込む形にはなるものの、 基本的には労働者数の固定化を招くものとなる。英語版で the current method restricts the number of laborers to those described in the master と記述した。 その文は以上のことを要約したものである。

回収率と抽出(比)率のページのまとめ

全国労働者数を推定するにあたり、理想的な“抽出率”を規定できるが、それは根源的不可能であるから、厚生省が現在提示する“抽出率”は次善策として考えられる方式である(容認できる)。 しかし、このように“抽出率”を規定し、計算実算入労働者数に抽出率の逆数を乗じる方法は、得られる推定労働者数を規定してしまう。 つまり、表面上“回収率”を織り込む式となっているが、実際には“回収率”に依存しない労働者数を導き出す仕組みとなっていることに注意が必要である。

調査対象事業所における月内変動を加えて補正する仕組みが加わっている。しかし、回収率低下の状況下では、(まず抽出率を規定し、補正を加えた後に抽出率逆数を乗じる方法によって)、 補正する増減を過剰に応答する構造(=仕組み)となっていることに注意が必要である。数学を理解できればわかるだろう。その他にも、この仕組みにはさまざまな欠点がある。それらについては、 今後機会があれば紹介する。