本ページでは、ハウスマン検定の概要についてまとめたい。とりわけ、ここではハウスマン検定を用いた固定効果と変量効果の判定について取り上げる。
固定効果と変量効果の概要については以下のページを参照されたい。
また、本ページでは行列を用いた表現が登場する。行列の基本的な表記方法や計算方法については以下のページを参照。
個別効果と説明変数が無相関である場合、変量効果モデルを用いる。反対に個別効果と説明変数に相関がある場合、固定効果モデルを用いる。ハウスマン検定によって、変量効果と固定効果のどちらを用いるべきか判別することが可能となる。
以下のような回帰式を考える。
x_itは個人iのt期における説明変数のベクトルを表す(説明変数の数をkとする)。μ_iは個人iの個別効果を表す。
ハウスマン検定における帰無仮説は、「個別効果と説明変数が無相関」である。反対に、対立仮説は「個別効果と説明変数に相関がある」となる。
変量効果モデルによって推定したβをβ_re、固定効果モデルによって推定したβをβ_feとする。もし帰無仮説が正しい(個別効果と説明変数が無相関)とき、変量効果モデルと固定効果モデルのどちらを用いても、推定値は一致性を持つことが知られている。しかし、個別効果と説明変数が相関しているとき、変量効果モデルを用いると一致性を失ってしまう。
それでは、いかなる場合でも固定効果モデルを用いればよいのではないか?ただし、個別効果が変量効果と相関していない場合においては、変量効果モデルを用いた方が効率性が高い(分散が小さい)ことが知られている。従って、
個別効果と説明変数が無相関→変量効果モデル
個別効果と説明変数に相関がある→固定効果モデル
という様にモデルを使い分けた方が良い。よって、帰無仮説が棄却できなければ変量効果モデル、帰無仮説が棄却できれば固定効果モデルを用いることとする。
個別効果と説明変数に相関があるとき、変量効果モデルの場合は一致性を失ってしまうため、変量効果モデルで推定した場合と、固定効果モデルで推定した場合で推定値に大きな差が生まれることが予想される。したがって、両者の推定値に大きな差があるとき、個別効果と説明変数に相関があると考えられ、よって固定効果モデルが採択されることとなる。以上がハウスマン検定の基本的な考え方となる。
具体的には、以下の統計量
が、自由度kのカイ二乗分布に従う。統計量が十分に大きければ帰無仮説は棄却され、固定効果モデルが用いられることとなる。
(参考):