時系列データにおける自己相関・定常性とは何か
本ページでは、時系列データにおける自己相関とは何かについてまとめたい。
時系列データの特徴
クロスセクションデータセットと異なり、時系列データは観測された順序が重要であり、時点で順序付けられたデータである。そして、時系列データはしばしば自己相関を示す。例えば、ある時系列データのt期における値は、t-1期、t-2期といった同じ系列の値と相関を示す可能性がある。
時系列分析では、観測された時系列データを確率変数の集合(確率変数列)の1つの実現値と考え、確率変数列の生成過程に何らかの構造があると仮定する。この確率変数列を確率過程(または単に過程)という。
自己相関係数
ある時系列データについて、t期と別の期の相関係数を求めることを考える。
まず、自己共分散は以下のように定義される。
ここで、μはyの期待値(平均)である。添字のkはt期との時間差を表し、k=1であれば、一期前との共分散を示す。
自己相関係数は、
で与えられる。自己相関係数は、kの関数として見ることができる。つまり、kが増えると(時期が遡っていくと)相関係数がどのように変化していくかを見ることができる。
定常性
時系列データが以下の性質を持つとき、そのデータには定常性があるという(厳密に言えば弱定常性という)。
要するに、ある時系列データに定常性があるとき、その期待値が時点によらず一定であり、共分散も時点には依存せず時間差のみに依存する。そしてこのとき、自己相関係数ρも時点には依存しないことになる。
例えばGDPが右肩上がりに上昇しているとき、データが定常性を満たしているとは言えないが、前の期との差分を取ったデータは定常性を満たしていることも多い。定常性の仮定は時系列モデルを構築する際に重要となる。
ある時系列データについて、将来の値を予測することを考える。定常過程の場合は長期的には一定の値に収束していく(平均回帰的)。一方、定常過程でない場合はその限りではなく、長期的な予測が難しくなる。
(参考):
沖本竜義(2010)「経済・ファイナンスデータの計量時系列分析」朝倉書店