操作変数法とは何か
本ページでは、操作変数法とは何かについてまとめたい。
回帰分析を行うことによってY(被説明変数)とX(説明変数)の因果関係を明らかにしたいとする。言い換えるとX→Yの因果があるかどうかを検証したいという状況を考える。
回帰分析を行ってXの相関係数が有意に正または負の値をとったとする。このことをもって、XとYには因果関係があると結論付けて良いだろうか?
例えばXとYそれぞれと関係がある共通の要因があり、それがXとYに強い相関があるように見せているだけなのではないか。例えば、年収と血圧に強い相関があったとして、血圧が高ければ年収が高くなると結論付けるのは誤りで、両者に影響を与える「年齢」というファクターを見落としているのである(このような変数を交絡因子という)。また、X→Yの関係を見たいところ、実はY→Xという逆の因果が発生している可能性もある(例えばXとYが連立方程式の解として同時に決定される場合にはXとYが相互に依存していることになる)。このようなときには、説明変数と誤差項の間に相関が生まれ、最小二乗法によって求めた推定量は一致性も不偏性も満たさなくなる。
それでは、X→Yの変化を正しくとらえるためにはどうすればよいか。このための一つの方法が操作変数法となる。
操作変数とは、説明変数とは関連があるが未測定の交絡因子とは関連がなく、かつ被説明変数とは説明変数を介してのみ関連するような変数であり、以下の図のようなイメージである。
選んだ操作変数が適切かどうかは、(1)説明変数と相関しているか(2)誤差項と相関がないか(被説明変数とは説明変数を通じてのみ相関しており直接の相関はないか)、の2点から検証することになる。
(1)については、XをZで回帰した式についてF検定を行い、F値が10以上であればこの条件を満たしていると考えて良いという経験則がある。
(2)については基本的には統計的な検定というよりは、概念的に(定性的に?)検証する形になる。
操作変数法を用いた推定方法に二段階最小二乗法がある。まず一段階目として、XをZに回帰する(Xが被説明変数、Zが説明変数)。この回帰によりZとXの関係を推定できた。そうすると、Zのサンプルの各データを与えた時のXの予測値を導き出せる(これをX’とする)。二段階目として、YをX’で回帰する。こうすることによって、操作変数を動かすことを通じたX→Yの効果を推定することができる。
(参考):