毎月勤労統計調査の統計学
毎月勤労統計調査 再集計版の内部構造は怪しい
毎月勤労統計調査の“再集計値”とは、厚労省が平成31年1月11日付けで公表した“毎月勤労統計調査において全数調査するとしていたところを一部抽出調査で行っていたことについて”
(いわゆる謝罪文)に記載されている、以下の点について、修正を施した結果の数値を表示した統計表である。
以下引用。「東京都における「500人以上規模の事業所」の平成30年の調査対象として抽出した事業所数は、全数調査であれば1,464事業所でしたが、実際に平成30年10月分の調査対象事業所数は
概ね3分の1の491事業所でした。」 に加え「東京都における「499人以下規模の事業所」等についても平成21年から平成29年までについて、一部に、異なる抽出率の復元が行われない集計となっていました。」引用終了
再集計版における労働者数の推移
毎月勤労統計調査における“従来の公表値”と“再集計値”について、2016年1月から2018年12月までの期間の、各群における労働者数をグラフに示した。 参考のため、2016年の“従来の公表値”も加えてある。よって横に長い線(下から順にA,B,C,D)が従来公表値で、それぞれの同色系の横に短い線が”再集計値”である。
別のページ、「東京都における約1000大規模事業所の脱落の影響0.6はウエイトシフトから導かれた値と推定する」で示したように、脱落した(させた)大規模事業所の1事業所当たりの平均労働者数は約750人であろうと推定した。 したがって、750人X973=73万人相当の労働者数がA群に加えられるだろうと推測していた。(注1)
“再集計値”と “従来の公表値”の労働者数の差を、各年の月平均 n=12 万人単位で示す。
2016年 | 2017年 | 2018年 | |
A群 | 70万人増 | 84万人増 | 33万人増 |
B群 | 55万人増 | 70万人増加 | 35万人増 |
C群 | 129万人減 | 159万人減 | 92万人減 |
D群 | 6万人増 | 6万人増 | 3万人増 |
全国平均給与額を0.6引き上げることから逆算して推定した73~75万人と、再集計値と従来公表値との差は良く一致している。
一方、B群における労働者数の増加は「異なる抽出率の復元」を補正したものであろうと推測するが、これだけ大きな労働者数の変動をきたす原因が何なのかは不明だ。(補足: 2月時点でこのように記したが、厚労省の「賃金データ 見方」(の付属資料)での記載から、B群の労働者数は従来が過剰に推定されていたから、再集計値では減少しなくてはいけない。 このページの下部に記載した。)
奇妙なのはC群で、129万~159万人の労働者数が減少している。これが「異なる抽出率の復元」の結果であるとはとても考えにくい。C群における減少させた労働者数は、 A群とB群で増加させた労働者数の和にほぼ一致する。C群での労働者数の“調整”は、全国レベルでの労働者数に大きな変動をきたさない処置であると推測する。 このことは、平均給与が高い群であるAと少し高い群であるB群のウエイトシフト効果、つまりウエイトシフトによる平均給与額の上方効果を際立たせる効果がある。
さらに特徴的なのは、D群の労働者数には(少し数字は異なっているのだが)ほとんど影響が無い。これはD群の調査方法が異なるためであり、また、2つの集計行、 30人以上(つまり第一種事業所の集計行)と全国レベルの集計行の2つともに整合性を取って調整する必要があり、D群までも動かすと複雑になりすぎるための処置と推測する。
A群における労働者数の差が2016年から2017年に70万人から84万人へと増加した(させた)のは、労働環境の改善により企業の労働者数の増加傾向を受けての処置だと推定する。 私サイドではそもそも何の根拠も持ち合わせていなく、厚労省が0.6だと言うからそれに合わせて75万人と推定したに過ぎない。一方、2018年に33万人に減少した(させた)のは、”新事業所”の 掌握が進み(別ページ 労働者数推移グラフの説明)、脱落事業所の取り込みが進んでいるためと推察する。それに合わせるかの如く、 B群およびC群の差も縮小してきている。特に、B群以下の事業所については2018年11月確報値から「異なる抽出率による復元は 修正された」と報道されたにもかかわらず、未だ若干の差が残っている。 修正が完了したら、再集計値と従来公表値における労働者数の差はA群だけになるはずである。タイムラグがあるのかもしれない。2019年1月以降の確報値でどうなっていくのか見ることにしよう。B群およびC群における労働者数の差はあるが、両群ともに、全国平均給与額との乖離幅は小さいので、全国平均給与額に及ぼす影響度は(A群に比べ)小さい。
ここまでの議論で一つ問題点を指摘しておきたい。
上記した厚労省の謝罪文では「平成30年10月分の調査対象事業所数は」と明記されているにもかかわらず、私はこれを「平成29年の」として議論を進めた。平成29年(2017年)でなくてもよい、脱落が始まったとされる2004年以降、”秘かな変更”が行われた2018年1月より前までのある時点(または一定期間の平均)の状態と受け止めた。もし厚労省の発表がすべて正しいとしたら、33万÷
(1464-491)=339人となって、500人以上の規模に該当しなくなる(注2)。
再集計版についての結論
再集計版のウエイト、つまり労働者数は極めて怪しい。しかし、そもそも再集計版は、全国平均給与額を0.6引き上げるという目的に合わせて”再構築”されたものであると割り切れば、
その内部構造についてあれこれと吟味することは無意味である。
毎月勤労統計調査の原表はやがて政府統計のデータベースに収録される。この時に、ぜひ”従来公表値”が採録されるよう願う。もし、”再集計値”が採録されるような事態になれば、将来、研究者が
内容を精査するようなこともあるだろう。その時に、再集計版のような”作為的な”資料が残ってしまうのは大きな問題だと考える。
いずれにせよ、私はこのような再集計版を作成公表すべきではなかったと考える。このような再集計版を公開することは、「目標となる全国平均給与額に合わせていかようにも原表を作成できます」と
いうことを自ら公表しているようなものだ。
毎月勤労統計調査:賃金データの見方
本稿を執筆したのは2月であるが、その後、厚労省は「毎月勤労統計調査:賃金データの見方」を公開した。これについては別ページに記載する。
ここでは本ページに関連することを補足する。
B群に関しては、東京都区分で、「事業所数が比較的少ない産業において異なる抽出率を設定し、標本数を多めに配分している。」 「産業毎の集計において抽出率逆数の差異を考慮しない処理となっていた。」
と記載されていた。この変動を受けた産業は、大分類 製造業Eの 8個の 中(小)分類である。多く割当てたにもかかわらず(他地域と)同一抽出比率で計算していたのだから、従来の集計が過剰な労働者数を示したことになる。
よって再集計値では労働者数は減少していなくてはならない。同様にC群ではE12 木材・木製品製造業と E22鉄鋼業のみであり、上記したほどの労働者数の減少をきたすことはありえない。
もう1点補足して、同資料から引用する。
平成16年に遡って追加支給を行うに当たり、「きまって支給する給与」に関して毎月勤労統計調査を基礎として加工し、「給付のための推計値」を作成。
「再集計値」を作成した平成24年~29年の間における「再集計値」と「公表値」のかい離幅の平均(0.6%)を平成16年の公表値に加え、それ以降の期間を公表値の伸び率に合わせて推計。(引用終)
なお、”乖離幅”は平成28年(2016年)には0.5~0.6であり、平成29年(2017年)は1点=10月分を除き0.6であるが、平成30年(2018年)には0.4から順次低下して0.3となっている。