"Decomposition of Differences in Distribution using Quantile Regression"

Melly, Blaise, 2005, "Decomposition of Differences in Distribution using Quantile Regression", Labour Economics, 12(4): 577-590.

This paper proposes a semiparametric estimator of distribution functions in the presence of covariates. The method is based on the estimation of the conditional distribution by quantile regression. The conditional distribution is then integrated over the range of covariates. Counterfactual distributions can be estimated, allowing the decomposition of changes in distribution into three factors: coefficients, covariates and residuals. Sources of changes in wage inequality in the USA between 1973 and 1989 are examined. Unlike most of the literature, we find that residuals account for only 20% of the explosion of inequality in the 80s.

この論文は、分位点回帰分析(Quantile Regression)を用いて、分布の差異を分解する手法を提案。

まず、分位点回帰分析によって、条件付き分布を推定する。
それを用いて、反事実的な分布が推定される。
反事実的な分布を用いて、時点間の分布の変化を、3つの要因(係数、共変量、残差)に分解することが可能になる。

例として、1973年から1989年の間のアメリカの賃金分布の変化を分析している。
反事実的な分布とは、たとえば、「共変量を1973年時点に固定したままで、係数だけが1989年のものであったとき、賃金分布はどうなるか?」というもの。
1973年の実際の分布は、共変量も係数の強さも1973年のもの。
このとき、反事実的な分布と実際の分布を比較して、たとえば反事実的な分布の方が格差が大きければ、それは、共変量が1973年から1989年で変化したから、と考える。

実際の賃金分布は、教育、経験、性別、産業、職業など、さまざまな共変量によって影響を受ける。共変量の効果とは、これらの数値が変化したために起こった変化。たとえば、高学歴化によって高学歴者が増えた、高齢化によって高齢者が増えた、など。

係数の効果とは、これらの共変量が賃金に与える効果が変化したために起こった変化。たとえば、賃金に与える教育の効果が増加したために、高学歴者の賃金が増加して、格差が広がった、など。

そして残差の変化とは、共変量の変化でも、係数の変化でも、説明できない変化。言い方を変えると、グループ間の変化、ともいえる。たとえば教育で説明すると、教育の分布が変化したのでも、教育が賃金に与える効果が変化したのでもない、変化。それはつまり、同じ教育を受けた人のなかで生じた変化。

この方法でアメリカの1973年から1989年までの変化を分析すると、残差は、賃金格差の全変化の約20%しか説明しない、ということがわかった。
これは、これまで提案された方法による結果とは、異なる。
格差を説明するうえで大事な要素は、共変量の変化である。

これまでの方法と筆者が提案した方法との違いを生じさせているのは、誤差の独立性の仮定である。
これまでの方法は、共変量と誤差の独立性を仮定しており、この独立性の仮定のもとでは、残差の効果が過大評価され、共変量の効果が過小評価されることになるという。
一方、分位点回帰分析は、不均一分散を仮定している。


筆者のHPでStataコードを手に入れることができたし、今度はやり方をちょっと勉強してみようと思う。
でも、この方法でわかることにどんな意味があるのか、もうちょっと考えてみないといけない。