季節性ARIMAモデル
モデル 1
- $\nabla_{s} Y_{t} := Y_{t} - Y_{t-s}$ として定義されたオペレーター$\nabla_{s}$ をシーズナル差分seasonal Differenceと言う。
- $W_{t} := \nabla^{d} \nabla_{s}^{D} Y_{t}$ として定義された$\left\{ W_{t} \right\}_{t \in \mathbb{N}}$が$ARMA(P,Q)$で、$\left\{ Y_{t} \right\}_{t \in \mathbb{N}}$が$ARMA(p,q)$なら、$\left\{ Y_{t} \right\}_{t \in \mathbb{N}}$はシーズナルARIMA過程 $ARIMA(p,d,q)\times(P,D,Q)_{s}$ と言う。このような形式をシーズナルARIMAモデルと言う。
説明
今日の気温はもちろん昨日の気温に最も大きく影響されるだろうが、基本的に夏は暑く、冬は寒い。例年になく寒い日や、例外的に暖かい冬があるかもしれないが、グローバルに見れば、季節に従わざるを得ない。このように、マクロ的な周期性を持って回ってくる性質を季節性seasonalityと言う。
例えば、AirPassengerは1949年から1960年までの月別の航空機の乗客数に関するデータで、夏の休暇シーズンにピークを迎え、徐々に減少するパターンを示す。年によって多かったり少なかったり、年が経つにつれて増加する傾向があるが、ともかく一年周期でみると、明確な季節性が現れる。
もちろん、季節性が実際の「季節」に関連する必要はなく、週による週間のトレンドであれ日単位で回る日間のトレンドであれ、ボードゲームのターンであれ、季節性と呼ぶことができる。順序があるデータなら、最終的には時系列データとして見ることができるだろうが、抽象的にアプローチすれば、実際に時間に関係する性質である必要もない。
シーズナルARIMA過程の定義は、一見非常に複雑に見えるが、その概念はARIMA過程のARIMA過程を超えない。数式的にも、ただ長い差分が生じて複雑に見えるだけで、なんかエレガントな洞察を得るのは難しい。ただ「もっと大きな流れがある」と受け止めてもいい。
Cryer. (2008). Time Series Analysis: With Applications in R(2nd Edition): p233~234. ↩︎