<金融アトラス/a>

金融アトラス

個人の勉強も兼ねて、少しずつまとめます。

見かけの相関(疑似相関)について平たく説明

本ページでは、見かけの相関(疑似相関)についてまとめたい。

 

まず、以下のような回帰分析を考える。

例えばyを血圧、xを年収とする。そして、β_1が正の値をとり、年収が高いほど血圧が高くなるという関係が得られたとする。この結果をもって、年収と血圧の間に因果関係があると判断してよいのだろうか?

この年収と血圧の他にも、考慮するべき変数がある。これは「年齢」である。一般に年齢が上がると血圧も上昇する傾向にある。一方、年齢が上がると、同じく年収が上昇する傾向にある。つまり「年齢」というファクターが、年収と血圧両方に影響を与えているのではないか。

x(年収)のみを変数としたとき、上記の回帰式では省略された年齢という変数によって、β_1の値はバイアスがかかっている可能性がある。

 

このように、回帰分析を行った際に省略された変数によって推定された回帰式にバイアスがかかってしまう場合がある。バイアスが発生しているかどうかは、以下の2つの条件を満たしているかをチェックすることによって確認することができる。

(1)省略された変数が説明変数と相関関係がある

(2)省略された変数が被説明変数と相関関係がある

 

(1)、(2)を両方満たすとき、回帰式にはバイアスが発生していると考えることができる。上記の例の場合は、年齢という変数が説明変数、被説明変数の双方と正の関係にあるため、正のバイアスが生じている(つまり年収と血圧の関係を過大に評価してしまう)。

 

逆に、(1)、(2)のどちらかを満たさない、すなわち相関関係がない場合は、バイアスは発生しない。

 

省略された変数が、説明変数あるいは被説明変数と負の相関関係にある場合は、負のバイアスが生じることになる。