回帰分析(6)


時系列回帰〜自己回帰

時系列データとは,通常同じ間隔の時間ごとに記録された数値のこと.例えば,毎日の株価,毎月の電気料金,毎年の出生数などが時系列データに相当する.時系列分析とは,こうした時系列データからそのデータに見合うモデルを作成し,将来の予測を行なう分析手法である.経済・経営の分野で多く用いられていて,これだけで一つの大きな分野を形成している.


【早速実行してみよう】
時系列モデルとは,例えば以下の式のようなものを考えてます.

t=a+b1t-1+b2t-2+b3t-3+u

ここで,tは期を示している.式は同一の変数における異時点間の関係を示している.このような形をしたモデルを時系列モデルと呼ぶ.上記の式はAR(Auto-Regressive:自己回帰)モデルと呼ばれていて,上記のように3次のARモデルの場合,AR(3)と表記する.

ARモデルデータ

上の例は1980年1月から2007年9月までのTOPIX(東証株価指数)の月次データです(実際にはもっとデータは続いてます).これを元に月次の収益率(変化率)を計算したものが列Eにあります.
この列を1期ずらしたものが列Fにあります.ここで,1980年3月からのデータを使って,AR(1)モデルを推定してみましょう.推定する回帰式は以下の式になります.分析ツールの「回帰分析」の結果を出力します.

Rt=a+b1Rt-1

AR(1)の回帰結果

推定された回帰式はR(t)=0.0048+0.069×R(t-1)となりましたが,傾きのP値が0.21と係数がゼロである帰無仮説を棄却できません.また,決定係数(重決定R2)も0.0048ととても低く,このデータにおいてはTOPIX収益率と1期前の収益率の間には因果関係が存在しないことが判ります.


【ではもう1つ】
もう1つ,今度は上手く推計できた例を.東京電力HPから拾った販売電力量のデータです.今年の電力量が昨年の電力量で説明されるとして,回帰式を推計してみます.

ARモデルデータ2

推計された回帰式は電力量(t)=13.52+1.02×電力量(t-1)となり,傾きの係数に対するP値は1%水準で有意にゼロと異なることが判ります.また,決定係数は0.99と高く,前年度の電力量で今年の電力量がとても上手く予測できていることになる,のですが,実はこの時系列データは定常性の問題を抱えています.

AR(1)の回帰結果2

【実は…】
時系列データの分析では,データが「定常性」を備えていることが重要です.例えば,データがトレンドを有している場合,トレンドによる影響で,本来関係がないのに見せ掛けの相関が現れることがあります(グラフを描いてみれば,トレンドの有無は判るよね).そのため,時系列データはその平均や分散が時間に依存せず一定であること,自己相関は時点差のみに依存することが求められています.これを「定常性」と呼びます.
この他,「単位根」と呼ばれる問題もあるのですが,ここでは省略.一般に定常性を得るために階差(差分)を取ったり,変化率を用いるというやり方が行われます.


【そこで】

販売電力量の階差(ΔY)を取って,ΔY(t)=a+b×ΔY(t-1)の自己回帰を推計すると,

AR(1)の回帰結果3

となりました.回帰係数の検定結果や決定係数からも,前の分析結果はトレンドに影響されたもので,販売電力量の変化という時系列には相関が存在しないことが判ります.


【気を取り直して別データで分析】

全国百貨店売上高(対前年同期比)のデータで自己回帰してみました.このデータはさまざまな変換を終えたものなので,定常性を有していると考えます.
推計結果を見ると,決定係数は0.42とさほどではありませんが係数は有意となっており,まずまずの推計ができたと考えられます.

AR(1)の回帰結果4


他に代表的な時系列分析の手法には以下ものがある.

この他に,扱う変数を多変量に拡張したモデル(VAR;Vector AutoRegressive)などがあります.


Copyright(C) 1997-2005 by ABE Keiji
All rights reserved.