バナー 老科学者の繰り言 論理と科学を語る

トップ 数値の表現 科学と論理 科学の周辺 番 外 プロフィール




毎月勤労統計調査の統計学

はじめに
2019年の年始に発覚した“毎月勤労統計調査不正問題”をめぐる喧噪が一段落した今、同統計調査を統計学の視点から考える良い機会と考える。 私は医学生物学(バイオ)分野の研究者で、定年退職してから長く経った。現役時代から、専門一流紙に掲載された原著論文に統計の誤り・誤用を多く見てきており、 我が国のトップクラスの研究室からの論文もまた同様であった。国際比較をしたのではないが、我が国の統計リテラシーは相当低いとの印象をかねてより抱いてきた。 “毎勤統計問題”に関する国会・報道・Web上の識者の議論は、手続き上の問題は除いて統計学の視点で、理解不足・焦点ずれと言わざるを得ないものであった。 また、この統計は経済学分野であるが、エコノミスト達の発言も表面的であり、本質から解説を試みるものは皆無だったと思われる。そこで、自然科学分野である私から、 統計学の基礎に基づいて毎月勤労統計調査の「統計」を”解剖”してみたい。(注1,2)

主要な結論

毎月勤労統計調査の実態は事業所調査であり、事業所における労働者数とその支払総額を調査して推計することにあると考える。多くの人達の関心の集まる全国平均給与額は、 推定値である労働者数をウエイトとして加重平均法で計算することによって導かれた(これもまた)推定値であり、元来、様々な原因に基づくウエイト変化(ウエイトシフト)によって影響を受けやすい 構造となっている。
2018年1月の”秘かな変更”によって、それ以降「全国平均給与額」が高い伸びを示すようになったのは、ベンチマーク更新によって、比較的給与額の低い群の労働者数が大幅に減少した ことによるウエイトシフトが主たる要因である。2017年12月から2018年1月の短期間に、全国規模で100万人以上の労働者が忽然と消えたのである。現実の社会では起きていないことが 統計上に生じたのであり、まさに数字のマジックのようなものだ。
統計における一つの代表値(毎勤では全国平均給与額)にとらわれることなく、統計学の基礎に基づいて、その数値の意味するところを正しく読み取り、理解する必要がある。

参考: 総務省 なるほど統計学園高等部から引用
不正確な情報や誤った印象に惑わされることなく情報を取捨選択していくには、信用に足る情報は何かを見抜き、様々に解釈できる情報を正しく読み解くための情報リテラシーを 身につけることが不可欠です。統計は事実をできるだけ客観的に捉えられるように作成されたものでなければなりません。また、統計を利用する際は、その統計が意味することを 正しく読み解かなければなりません。

毎月勤労統計を理解するために必要な統計用語(概念) 層化抽出法 加重平均 ウエイト

毎月勤労統計調査(全国調査。以下 ”毎勤”と略すことがある)を理解するには、「層化抽出法」と「加重平均」を理解しなくてはならない。特に後者の「重み」英語でweight ウエイト概念 の理解が必須である。 それぞれ別にページを準備した。ここではポイントのみ簡潔に記載する。
1) 毎勤で、なぜ層化抽出法を使用するのか?  対象集団の特徴的な構造:大規模事業所は少数(約0.3%)であるが、そこには多数の労働者(>10%)がいる。
2) 毎勤で、なぜ500人以上の大規模事業所を“全数調査”としているのか?  単に、”規則だから”ではなく、統計学の知識に基づいて、そのような規則が設けられている。結果に大きく影響する存在、いわば”インフルエンサー”的存在があるので、無作為抽出によって統計に組み込まれたり/ 組み込まれなかったりすると、結果の変動が大きくなり、統計の精度が悪くなるからである。
3) 上記1、2を通じて“低確率事象の安定的把握”という科学の基本概念(知識)から想起することが重要である。

労働者数の推移 グラフ

ウエイトとして機能する、毎勤の各層(統計用語としての strata 以下、ここでは群と呼ぶ(ことが多い))の労働者数推移をグラフに示す。

毎月勤労統計 ウエイトとして機能する各群の労働者数の推移

グラフの説明を次ページに記載する
このサイト「毎月勤労統計調査の統計学」の各ページを通じての、用語・省略語の説明を別ページに記載した
根拠となる資料の出典、Excel計算値 など

2018年6月における全国平均給与の高い伸び その背景をウエイトシフトで説明する

大規模・東京都区分での約1000事業所の脱落の”補償”として0.6上昇させる。これは東京都の事業所が”高給取り”だから という考えが一般的だ。そうかもしれないが、 実際の調査をしないで早々に決定された。0.6は約75万人労働者の追加によるウエイトシフトから導かれたと推定する

”再集計版”の“内部構造”は怪しい。目標とする全国平均給与額の値に合わせて再構築された表である

回収率と抽出率
現在の 毎月勤労統計調査では、見かけ上、回収率を考慮した形となっている。いつの時点でこの考えを導入し、その時、何がなされたか?

毎月勤労統計調査問題に関する雑感 私サイドの経緯と所見

当面ここまで。余力があれば、統計学の置かれた立場、国の施策としての統計学の役割 などについても語りたい