계절형 아리마 모형
모델 1
- $\nabla_{s} Y_{t} := Y_{t} - Y_{t-s}$ 와 같이 정의된 오퍼레이터 $\nabla_{s}$ 를 계절형 차분seasonal Difference이라 한다.
- $W_{t} := \nabla^{d} \nabla_{s}^{D} Y_{t}$ 와 같이 정의된 $\left\{ W_{t} \right\}_{t \in \mathbb{N}}$ 가 $ARMA(P,Q)$ 고 $\left\{ Y_{t} \right\}_{t \in \mathbb{N}}$ 이 $ARMA(p,q)$ 면 $\left\{ Y_{t} \right\}_{t \in \mathbb{N}}$ 는 계절형 아리마 과정 $ARIMA(p,d,q)\times(P,D,Q)_{s}$ 라고 한다. 이와 같은 꼴을 한 시계열 분석 모형을 계절형 아리마 모형이라 한다.
설명
오늘의 기온은 물론 어제의 기온에 가장 큰 영향을 받겠지만, 기본적으로 여름엔 덥고 겨울에 춥다. 유난히 추운 날, 유난히 따뜻한 겨울이 있을 수는 있어도 글로벌하게는 계절을 따라갈 수밖에 없다. 이렇듯 거시적인 주기를 가지고 돌아오는 성질을 계절성seasonality이라 한다.
예로써 AirPassenger는 1949년부터 1960년까지 월별 항공기의 승객 수에 대한 데이터로, 휴가철인 여름에 피크를 찍고 차츰 줄어가는 패턴을 보인다. 해마다 많고 적고, 해가 갈수록 늘어가는 경향이 있기는 하지만 어쨌든 한 해 주기로는 전형적이라고 할 수 있을 정도의 뚜렷한 계절성이 나타난다.
물론 계절성이 정말 ‘계절’에 연관될 필요는 없으며, 요일에 따른 주간 추이든 하루를 단위로 돌아가는 일간 추이든 보드게임의 턴이든 계절성이라고 부를 수 있다. 순서가 있는 데이터면 결국 시계열 데이터로 볼 수야 있겠지만, 추상적으로 접근하면 사실 시간에 따른 성질일 필요도 없다.
계절형 아리마 과정의 정의는 무척 복잡해보이지만 그 개념만 보면 아리마 과정의 아리마 과정에 지나지 않는다. 수식적으로도 그냥 긴 차분이 생겨서 지저분하기만 할 뿐 어떤 우아한 통찰을 얻기는 어렵다. 그냥 ‘더 거대한 흐름이 있다’ 정도로 받아들여도 무방하다.
Cryer. (2008). Time Series Analysis: With Applications in R(2nd Edition): p233~234. ↩︎