毎月勤労統計調査の統計学
雑感 毎勤統計調査においてウエイトとして機能する 各群の労働者数推移グラフの補足
「毎月勤労統計調査の統計学」では統計学の立場で説明し、政治的・経済的なことには触れたくないというのが筆者の主旨であるが、少しだけ付記したい。 なお、このページは、論文でいうDiscussion部分であり、Resultではない。
主として2012から2017年のD群における労働者数の増加は、経済の活況ならびに雇用関係良好の裏付けとなるはずのもので、安倍政権運営の成果の一つとして取り上げられても 良い例と考える。しかしながらD群は平均給与額が比較的安い群であり、その労働者数の伸びは全国平均給与頸を押し下げる因子となる。こうしたジレンマを解消する一つの手段として、 年齢調整がん罹患率(易しく言えば発症率、また年齢調整がん死亡率など)の適用を考えてみた。
現在までの分子生物学の成果によって、がんは体細胞における突然変異の蓄積によることが確立しており、年齢によってがん罹患率が上昇することは容易に理解できる。
したがって、特定の年齢別構成を持つ集団をあらかじめ規定し、各年齢層の人口(ウエイトとなる)を規定した上で、それぞれの年齢別の罹患率を適用して計算する手段である。
科学的・合理的な裏付けがある手法であるが、皮肉っぽく言うと、基礎であれ臨床であれ医療関係者の努力にもかかわらず、高齢化していく先進諸国においてがん罹患率・死亡率は低下せず、
むしろ増加する傾向にある。そこで統計の専門家である疫学者が協力し、年齢調整型がん罹患率・死亡率を考案し、医学の成果をアピールする手段としたのである。
少し皮肉を込めてこのように記載したが、科学・学問はそのようなニーズに応じて発展していくものだというご理解をいただきたい。
肝心なことは“真実に迫る”ということ。何が真実なのかは哲学の重要な命題となる。
このようなウエイトを調整して統計を取ることを毎勤調査に適用する場合、逆に、ウエイト固定型とすることが考えられる。つまり、推定値である労働者数をウエイトとするのではなく、
一定のウエイトで計算するのである。どの時点のウエイトを適用するかはさまざまであるが、ウエイト固定型で試算した結果、全国平均給与額は従来公表値とほとんど変わらなかった。
つまり、ウエイト固定型とすることによって、比較的低い給与のD群の労働者数の伸び効果は抑制されるが、一方で、比較的高い給与のAおよびB群における労働者数の伸びも反映されなくなり、
両者ともに相殺されるのである。
さらに試算を続けた。D群の労働者数のみ一定に保ち、他群の変動をそのままにする手段である。アンフェアとか、いったいどんな意味があるかと問われかねないが、あくまで思考実験、試算の内とご容赦願いたい。
実際そのような試算をすると、たしかにそれなりの全国平均給与額の伸びを観測できた(当然の帰結)。その金額の差はここでは明記しない。興味ある方は試算されたら良い。
しかし次の点は強調しておきたい。2017年までの毎勤統計調査の手法では、比較的安い給与のD群にだけ“新規把握事業所”の参入を許す一方、他群でそれが無かったことである。 BとC群は抽出調査であり、その労働者数はベンチマークに強く規定されてしまう。この点は、別ページの回収率と抽出率で詳しく述べる予定である。それに対してA群は”建前として“”全数調査“であり、2018年以降のように中央省庁の役人がもう少し積極的であったならば、”新事業所“を把握できたはずである。 たとえばベンチマークが更新された2009年初と2012年初と2018年初の頭をつなぐ線で回帰できるような労働者数の伸びが得られていたら、この間の全国平均給与額は少し違った推移を取ったであろうことは容易に想像できる。