logo

R 에서 아리마 모형으로 얻은 시계열 분석 결과 보는 법 📂통계적분석

R 에서 아리마 모형으로 얻은 시계열 분석 결과 보는 법

실습

ap.png

R 내장데이터 AirPassenger는 1949년부터 1960년까지 월별 항공기의 승객 수에 대한 데이터다.

20190716\_172754.png

  • (1) 모형: 사실 계수만 제대로 파악할 수 있다면 중요한 것은 아니다.
    계절형 아리마 모형 $ARIMA(p,d,q)\times(P,D,Q)_{s}$ 을 나타낸다. 예로써 위 분석의 결과인 ARIMA(0,1,1)(0,1,1)[12]는 $ARIMA(0,1,1)\times(0,1,1)_{12}$ 를 의미한다.
  • (2) 계수: 모형에 맞는 계수를 나타낸다. ma1은 이동평균과정의 계수 $\theta_{1}$ 이고, sma1은 계절성이 적용된 계수다. 앞부분은 모형의 종류, 뒷부분은 시차를 나타낸다. 보다시피 s-가 붙으면 계절성이 적용되는 것이다.
    • 위 분석 결과에는 없지만 ar은 자기회귀과정의 계수 $\phi$ 를 의미한다.
    • drift는 드리프트라고 하는 것으로, 자주 보이지 않고 나타나도 대개는 유의하지 않으나 대략적으로는 알아둘 필요가 있다.

20190717\_140622.png

  • (3) 표준오차: 이것을 통해 가설검정을 한다.
    대강 계수의 절대값이 표준오차의 2배 이상이면 유의한 계수로 본다. 여기서 하필 2배인 이유는 보통 유의수준이 $\alpha = 0.05$ 기 때문이다. 더 정확하게 하고싶다면 1.96배를 사용하면 되고, 자연스럽게 유의수준 $\alpha = 0.01$ 이라면 2.58배, $\alpha = 0.1$ 이라면 1.65배를 사용하면 된다는 것을 알 수 있을 것이다. [ NOTE: 이론적으로는 표본자기상관함수표본편자기상관함수가 정규분포를 따른다는 사실을 이해해야한다. 적어도 통계 전공자라면 한 번은 제대로 공부하는 것을 추천한다. ] 가령 바로 위의 oil.price에 대한 분석을 보자.
    • ar1 : $| \phi_{1} | = 0.4574 < 0.2722 \times 2 = 0.5444$ 이므로 유의하지 않다.
    • ma1 : $| \theta_{1} | = 0.2400 < 0.2722 \times 2 = 0.5508$ 이므로 유의하지 않다.
    • ma2 : $| \theta_{2} | = 0.2563 > 0.0736 \times 2 = 0.1472$ 이므로 유의하다.
    • drift : $ | b | = 0.1812 < 0.1246 \times 2 = 0.2492$ 이므로 유의하지 않다. 다시 말해 $ARIMA(0,1,2)$ 모형에 $\theta_{1} = 0$ 이나 마찬가지고, 식으로 써보자면 $$ \nabla y_{t} = e_{t} + 0.2563 e_{t-2} $$

물론 이로써 분석이 끝났다고 할 수는 없다. 이는 아주 단순하게 판단한 것이고, 이보다는 좀 더 깊이 있게 데이터를 이해해서 제대로 된 결론을 얻어내야한다. 다만 결과를 보는 방법이 이러하다는 것일 뿐이다.