本ページでは、差の差(Difference-in-Difference)の分析についてまとめたい。差の差の分析は、ある政策による時間を通じた効果を測定したい場合に有用な分析手法となる。
パネルデータ
パネルデータとは、個人や地域、企業のデータを複数時点で観測したものである。クロスセクションデータと時系列データを組み合わせたものということもできる。
パネルデータの利点は「情報量の多さ」である。サンプル数100の標本について、10年分のデータが取れるとしたら、100×10=1000のデータを得られることになる。
パネルデータを使うことで、観測対象について、施策の前後の変化を検証することが可能となる。パネルデータを用いた分析にこれから述べる「差の差の分析」などがある。
差の差の分析
例えば、灌漑施設の建設が周辺地域の経済成長に影響を与えたかを計測したいとする。政策の効果を測りたいと考えた時、政策を実施した対象(処置群)について前後の値(ここでは例えばGDP)を比較するだけでは不十分である。仮に建設の前後でGDPが増えていても、それが灌漑建設のためなのか、国全体の経済成長に引っ張られてその地域の経済も成長しただけなのか分からないためだ。
そこで、灌漑施設が建設された地域とは別の地域(対照群)と比較する必要が生じる。どのように比較するかというと、処置群における灌漑建設前後のGDPの変化と、対照群におけるGDPの変化の差をとる。これが「差の差」と呼ばれるゆえんとなる。
例えば処置群においてGDPが3成長していて、対照群において1成長していたとしたら、差分の2は灌漑施設に起因する処置群特有の成長で、1は両地域に共通する要因(例えば国全体の経済成長など)による成長であると考えることができる。ここで重要なのは、処置群と対照群は、灌漑建設の有無以外についてはすべて諸条件が同じであることである。言い換えれば、もし灌漑建設が建設されなければ、経済成長について処置群と対照群は全く同じトレンドを辿ると考えられることが差の差の分析を用いる際の条件となる。そうでなければ、差分の2の成長を灌漑施設の建設によるものと結論付けることができなくなってしまう。
表にまとめると以下のようになる。a,bというのは政策による効果を測定したい指標である。この(a'-a)-(b'-b)が、差の差の推定量となる。
回帰式を用いた差の差の分析
差の差の分析は、回帰式を用いて行うこともできる。
回帰式は以下のようになる。
treatmentは処置群であれば1の値を取るダミー変数(時間を通じて一定で処置群特有の効果を表す)、afterは政策実施後であれば1をとるダミー変数(地域に関わらず一定で政策実施後特有の効果を表す)、treatment×afterは交差項であり、処置群特有の政策実施による効果を表す。
推定量は以下の表のようにまとめられる。
β_3が処置群における政策効果(差の差の推定量)と考えることができる。
(参考):
Stock, Watson(2017)"Introduction to Econometrics 3rd edition", Pearson