本ページでは、単位根過程・単位根検定についてまとめたい。単位根過程は、時系列データの分析を行う際に登場する概念である。
本ページでは時系列データ分析に関する用語がいくつか登場する。まず、自己相関や定常性といった基本的な考え方については、以下のページでカバーしている。
そして、ARモデルに関する最低限の説明は、以下のページで行っている。これらの用語が初めての方はまずはこちらを参照されたい。
単位根過程
ある時系列データyが非定常である一方、その差分(t期のyとt−1期のyの差)を取ると定常性を満たすとき、yは単位根過程であると呼ばれる。1次和分過程I(1)とも呼ばれる。
ランダムウォーク
単位根過程の代表例として、ランダムウォークが挙げられる。ランダムウォークは、
で与えられる。撹乱項εの期待値は0、分散はσ^2である。
ランダムウォークは、t-1期のyの係数が1のAR(1)モデルと考えることもできる。AR(1)モデルが定常性を満たすには、この係数の絶対値が1未満でなくてはならない(本ページではこの理由に関する説明は省略)。したがって、ランダムウォークは定常性を持たない。
δは「ドリフト」と呼ばれる。ランダムウォークの式を改めて見てみると、t期のyは、前期のyにドリフト(と撹乱項)を加えたものとなる。ドリフトの存在は、yの期待値が0でないことを意味する。
DF検定とは
データが単位根過程に従っているかを検証するための検定(単位根検定)として、DF(Dickey-Fullar)検定というものがある。
そもそもの仮説検定の基本的な考え方については以下のページを参照。
DF検定における帰無仮説と対立仮説は以下のようになる。
帰無仮説:データが単位根を持つAR(1)モデルに従う(θ=0)
対立仮説:データが定常性を持つAR(1)モデルに従う(θ≠0)
帰無仮説を棄却できなければ、データは単位根過程に従っていることになる。
上記のθとは何か?まず、以下のAR(1)過程を考える。
2行目の(*)式は、両辺をt-1期のyで差し引いたものである。ここで、ρ-1=θとおく。
単位根過程に従っているとき、上述の通り、ρ=1すなわちθ=0となる。逆に定常過程である場合はρ<1すなわちθ≠0である。DF検定ではθの値を検証することになる。
また、DF検定を行う際、具体的にモデル(回帰式)を特定しなければならないが、データの性質に応じて以下の3つの場合がある。
①ドリフトなし、トレンドなし・・・*式のまま
②ドリフトあり、トレンドなし・・・*式に定数項μを追加
③ドリフトあり、トレンドなし・・・*式に定数項μとトレンド項δ×tを追加
①は、yの期待値が0であり、かつデータに線形のトレンドがない場合。②は、yの期待値が0ではなく、データに線形のトレンドがない場合。③は、yの期待値が0ではなく、データに線形のトレンドがある場合となる。
(*)式を最小二乗法により推定し、t統計量を求める。ただし、棄却域の算定に当たっては通常のt分布を使用することはできず、代わりにDickey-Fuller表を基に棄却域を設定する。その際、上記の3つのモデルによって、棄却域は変わってくることになる。統計量(必ずマイナスの値を取る)が臨界値より低ければ、帰無仮説は棄却される。
ADF検定
DF検定はAR(1)過程を想定したものである。DF検定を拡張し、AR(p)過程が単位根を持つかどうかを検定したものがADF(Augmented Dickey–Fuller)検定である。
DF検定における(*)式を、以下のように拡張する。
検定の手続きはDF検定と同様である。(**)式ではトレンド項と定数項が既に含まれているが、やはり①~③のバージョンを検定の際には検討することになる。以下のリンクからAugment Dickey-Fuller表を参照でき、ADF検定における臨界値を調べることができる。
p(ラグの数)を決定するツールとして、情報量基準がある。情報量基準を最小にするようなラグ数が最適であると考えられている。情報量基準には赤池情報量基準(AIC)やベイズ情報量基準(BIC)がある。候補となるモデルについて、ラグ次数を変えてみてそれぞれについて情報量基準を算出し、最も低い値が出たものを採用することができる。
AICは、
AIC=-2ln(L)+2k
で与えられる。Lは最尤法によって求めた最大尤度、kは推定したパラメータ数である。
BICは、
BIC=-2ln(L)+kln(n)
で与えられる。nは推定の際に用いたサンプル数である。
単位根過程を持つ時系列データの予測、統計的推測
ある時系列データについて、将来の値を予測することを考える。定常過程の場合、長期的には一定の値に収束していく(平均回帰的)。例えば定常AR(p)過程の将来予測をしようとしたとき、短期的には(例えばt+1期、t+2期)、t期までの値が将来値に影響を与えるので、t期までの情報を織り込んだ条件付き期待値を求めることで予測誤差を小さくできる。一方で、長期的にはt期の値に関わらず、一定の値(条件なし期待値)に収束していく。これは、t期の系列値の影響が時間と共に減少していくためである。しかし、単位根過程の場合はその限りではなく、平均回帰的ではないため、長期的な予測が難しくなる。
一方、単位根過程に従う時系列データの統計的な推測を考える。例えば真のモデルをAR(1)過程として、OLSによって推定するとする。このとき、たとえ単位根に従っていたとしても、基本的には通常の手続き(推定量に対してt検定を行う)を踏むことができることが知られている。もっとも、一部の仮説についてF検定を用いることができないなどの注意点はある。
(参考):
沖本竜義(2010)「経済・ファイナンスデータの計量時系列分析」朝倉書店