R 에서 아리마 모형으로 얻은 시계열 분석 결과 보는 법
실습
R 내장데이터 AirPassenger
는 1949년부터 1960년까지 월별 항공기의 승객 수에 대한 데이터다.
- (1) 모형: 사실 계수만 제대로 파악할 수 있다면 중요한 것은 아니다.
계절형 아리마 모형 $ARIMA(p,d,q)\times(P,D,Q)_{s}$ 을 나타낸다. 예로써 위 분석의 결과인ARIMA(0,1,1)(0,1,1)[12]
는 $ARIMA(0,1,1)\times(0,1,1)_{12}$ 를 의미한다. - (2) 계수: 모형에 맞는 계수를 나타낸다. ma1은 이동평균과정의 계수 $\theta_{1}$ 이고, sma1은 계절성이 적용된 계수다. 앞부분은 모형의 종류, 뒷부분은 시차를 나타낸다. 보다시피 s-가 붙으면 계절성이 적용되는 것이다.
- (3) 표준오차: 이것을 통해 가설검정을 한다.
대강 계수의 절대값이 표준오차의 2배 이상이면 유의한 계수로 본다. 여기서 하필 2배인 이유는 보통 유의수준이 $\alpha = 0.05$ 기 때문이다. 더 정확하게 하고싶다면 1.96배를 사용하면 되고, 자연스럽게 유의수준 $\alpha = 0.01$ 이라면 2.58배, $\alpha = 0.1$ 이라면 1.65배를 사용하면 된다는 것을 알 수 있을 것이다. [ NOTE: 이론적으로는 표본자기상관함수와 표본편자기상관함수가 정규분포를 따른다는 사실을 이해해야한다. 적어도 통계 전공자라면 한 번은 제대로 공부하는 것을 추천한다. ] 가령 바로 위의 oil.price에 대한 분석을 보자.- ar1 : $| \phi_{1} | = 0.4574 < 0.2722 \times 2 = 0.5444$ 이므로 유의하지 않다.
- ma1 : $| \theta_{1} | = 0.2400 < 0.2722 \times 2 = 0.5508$ 이므로 유의하지 않다.
- ma2 : $| \theta_{2} | = 0.2563 > 0.0736 \times 2 = 0.1472$ 이므로 유의하다.
- drift : $ | b | = 0.1812 < 0.1246 \times 2 = 0.2492$ 이므로 유의하지 않다. 다시 말해 $ARIMA(0,1,2)$ 모형에 $\theta_{1} = 0$ 이나 마찬가지고, 식으로 써보자면 $$ \nabla y_{t} = e_{t} + 0.2563 e_{t-2} $$
물론 이로써 분석이 끝났다고 할 수는 없다. 이는 아주 단순하게 판단한 것이고, 이보다는 좀 더 깊이 있게 데이터를 이해해서 제대로 된 결론을 얻어내야한다. 다만 결과를 보는 방법이 이러하다는 것일 뿐이다.