時系列データの分析 - 名古屋大学•auto regressive (ar) model では,目的変数...
TRANSCRIPT
時系列データの分析
時系列データ
時系列データ = トレンド + 周期性 + ランダム性
• トレンド
–潮流,流行.傾向変動(経済学).
• 周期性
–特定の現象が一定期間ごとに現れる
• ランダム
–予測できない動き.ホワイトノイズで表現する.
自己回帰モデル
• 経済指標予測や気象予測など,時系列データの予測にもっとも一般的に用いられる方法が自己回帰モデルである.
• 最も簡単な線形自己回帰は次式で与えられる.
• 線形自己回帰モデルでは,目的変数は目的変数の過去値を説明変数とする.
自己回帰モデル
自己回帰(AutoRegressive)モデル:AR(p)
𝑥𝑡 = 𝑎0 + 𝑎𝑖𝑥𝑡−𝑖
𝑝
+ 𝜖𝑡
ここで,誤差項
𝜖𝑡 = 𝜎𝑍 𝑍 ∈ 𝑁(0,1)
• 過去の値の一次関数と誤差(ランダム)との和で表現する.
移動平均モデル
移動平均(Moving Average)モデル:MA(q)
𝑥𝑡 = 𝑏0 + 𝑏𝑖𝜖𝑡−𝑖
𝑞
+ 𝜖𝑡
過去のランダムの一次関数で表現する
自己回帰移動平均モデル
• 自己回帰移動平均(Autoregressive and Moving Average)モデル:ARMA(p,q)
𝑥𝑡 = 𝑎0 + 𝑎𝑖𝑥𝑡−𝑖
𝑝
+ 𝑏𝑖𝜖𝑡−𝑖
𝑞
+ 𝜖𝑡
• ここで,誤差項
𝜖𝑡 = 𝜎𝑍 𝑍 ∈ 𝑁(0,1)
モデルの選択
• モデルの選択とモデル次数p,qの選択が必要
• 簡単には,各時間差に自己相関係数を求め,その最も大きいものからモデルを定める.
• 情報量基準(AIC)を用いる場合もある.
ボラティリティ変動モデル
株価変動の特性
• 分散不均一性(heteroscedasticity)
–景気の拡大期では,変動率(ボラティリティ)が平均して小さい.
–継起の縮小期では,変動率が平均的に大きい.
–変動率が時期によって異なる傾向を示すことを分散不均一性と呼ぶ.
• ボラティリティ変動モデル
–ボラティリティを時間変化する.
前提
時系列データが次のように表現できる. 𝑥𝑡 = 𝑥 𝑡 + 𝜖𝑡
ここで,𝑥 𝑡は予測値,𝜖𝑡は予測値からの乖離幅.
乖離幅を次式で表現する. 𝜖𝑡 = 𝜎𝑡𝑁𝑡
𝜎𝑡:ボラティリティ
𝑁𝑡:正規乱数
分散自己回帰モデル
分散自己回帰(Autoregressive conditional heteroscedasticity)モデル: ARCH(q)
• ボラティリティを次式から求める.
𝜎𝑡2 = 𝛼0 + 𝛼𝑖𝜖𝑡−𝑖
2
𝑞
GARCHモデル
Generalized Autoregressive conditional heteroscedasticity (GARCH)モデル:
GARCH(p,q)
𝜎𝑡2 = 𝛼0 + 𝛼𝑖𝜖𝑡−𝑖
2
𝑝
+ 𝛽𝑖𝜎𝑡−𝑖2
𝑞
ARCHと比較して,GARCH(1,1)が最も多く用いられる.
改良モデル
• Exponential GARCH (GARCH)モデル:
EGARCH(p,q)
log 𝜎𝑡2 = 𝛼0 + 𝛼𝑖𝜖𝑡−𝑖
2
𝑞
+ 𝛽𝑖𝜎𝑡−𝑖2
𝑞
• Integrated GARCH (IGARCH)
• Nonlinear GARCH (NGARCH)
気温の予測
Dischel –D1モデル
𝑇𝑖 = 𝛼 × Θ𝑖 + 1 − 𝛼 × 𝑇𝑖−1 + 𝜖𝑖
𝑇𝑖:観測期間中の第i日目の気温 Θ𝑖:i日目にあたる日付の平年気温 𝛼 :係数 𝜖𝑖:独立な確率変数 (平均μ、標準偏差σの正規分布) • 気温は,過去の平均気温と前日の気温,誤差項で表現できる.
Cao-Wei日々気温変動モデル
𝑇𝑖 = Θ𝑖 + 𝜌𝑘𝑈𝑖−𝑘 + 𝜎𝑖 × 𝜖𝑖
𝑚
𝑘=1
+ 𝑡𝑟𝑒𝑛𝑑𝑖
𝑡𝑟𝑒𝑛𝑑𝑖 =𝑏
365𝑘 −
𝑁
2
𝑇𝑖:観測期間中の第i日目の気温 Θ𝑖:i日目にあたる日付の平年気温 𝑈𝑖−𝑘:第i日目の気温と第i-k日目の平年気温の差 𝜌𝑘 , 𝜎𝑖 :係数 𝜖𝑖:平均μ、標準偏差σの正規分布に従う独立な確率変数
パラメータの決定
• 過去の気温データから最小2乗法を用いて定める.
• 過去の気象データ – 気象庁・気象統計情報
(http://www.data.jma.go.jp/obd/stats/etrn/index.php)
– NASA(http://data.giss.nasa.gov/gistemp/station_data/)
• 東京の場合 – a=0.2237, μ=0.7763,σ=2.3734
自己回帰モデル:演習
自己回帰モデル
• Auto Regressive (AR) Model では,目的変数は目的変数の過去値を説明変数とする.
𝑥𝑡 = 𝑎0 + 𝑎𝑖𝑥𝑡−𝑖
𝑝
𝑖=1+ 𝑢𝑡
𝑢𝑡 ∈ 𝜎2𝑁(0,1)
• 係数𝑎𝑖は最尤推定を用いて決定する.
• ここでは簡単のため重回帰分析を用いることにする.
AR(1)モデル(1)
AR(1) (𝑝 = 1の場合) 𝑥𝑡 = 𝑎0 + 𝑎1𝑥𝑡−1 + 𝑢𝑡
誤差項𝑢𝑡を無視すると 𝑥𝑡 = 𝑎0 + 𝑎1𝑥𝑡−1
この係数𝑎0, 𝑎1を求める.
方法
・ 𝑥𝑡と𝑥𝑡−1で線形回帰分析を行う.
AR(1)モデル(2)
AR(1) 𝑥𝑡 = 𝑎0 + 𝑎1𝑥𝑡−1 + 𝑢𝑡
を変形すると,誤差項は 𝑢𝑡 = 𝑥𝑡 − (𝑎0 + 𝑎1𝑥𝑡−1)
上式の誤差の平均と分散を計算する.
方法
1. 誤差を求める.
2. 誤差の平均と標準偏差を求める.
3. AR(1)モデルで予測をする.
AR(2)モデル(1)
AR(2) (𝑝 = 2の場合) 𝑥𝑡 = 𝑎0 + 𝑎1𝑥𝑡−1 + 𝑎2𝑥𝑡−2 + 𝑢𝑡
誤差項𝑢𝑡を無視すると 𝑥𝑡 = 𝑎0 + 𝑎1𝑥𝑡−1 + 𝑎2𝑥𝑡−2
この係数𝑎0, 𝑎1, 𝑎2を求める.
方法
・ 𝑥𝑡, 𝑥𝑡−1, 𝑥𝑡−2で重回帰分析を行う.
AR(2)モデル(2)
AR(2) 𝑟𝑡 = 𝑎0 + 𝑎1𝑟𝑡−1 + 𝑎2𝑟𝑡−2 + 𝑢𝑡
を変形すると,誤差項は 𝑢𝑡 = 𝑟𝑡 − (𝑎0 + 𝑎1𝑟𝑡−1 + 𝑎2𝑟𝑡−2)
上式の誤差の平均と分散を計算する.
方法
1. 誤差を求める.
2. 誤差の平均と標準偏差を求める.
3. AR(2)モデルで予測をする.
演習問題
• 実際の株価データで同様のことを行う.
誤差 = |予測値 - 実測値|