R 에서 아리마 모형으로 얻은 시계열 분석 결과 보는 법
📂통계적분석R 에서 아리마 모형으로 얻은 시계열 분석 결과 보는 법
실습

R 내장데이터 AirPassenger
는 1949년부터 1960년까지 월별 항공기의 승객 수에 대한 데이터다.

- (1) 모형: 사실 계수만 제대로 파악할 수 있다면 중요한 것은 아니다.
계절형 아리마 모형 ARIMA(p,d,q)×(P,D,Q)s 을 나타낸다. 예로써 위 분석의 결과인 ARIMA(0,1,1)(0,1,1)[12]
는 ARIMA(0,1,1)×(0,1,1)12 를 의미한다. - (2) 계수: 모형에 맞는 계수를 나타낸다.
ma1은 이동평균과정의 계수 θ1 이고, sma1은 계절성이 적용된 계수다. 앞부분은 모형의 종류, 뒷부분은 시차를 나타낸다. 보다시피 s-가 붙으면 계절성이 적용되는 것이다.
- 위 분석 결과에는 없지만 ar은 자기회귀과정의 계수 ϕ 를 의미한다.
- drift는 드리프트라고 하는 것으로, 자주 보이지 않고 나타나도 대개는 유의하지 않으나 대략적으로는 알아둘 필요가 있다.

- (3) 표준오차: 이것을 통해 가설검정을 한다.
대강 계수의 절대값이 표준오차의 2배 이상이면 유의한 계수로 본다. 여기서 하필 2배인 이유는 보통 유의수준이 α=0.05 기 때문이다. 더 정확하게 하고싶다면 1.96배를 사용하면 되고, 자연스럽게 유의수준 α=0.01 이라면 2.58배, α=0.1 이라면 1.65배를 사용하면 된다는 것을 알 수 있을 것이다. [ NOTE: 이론적으로는 표본자기상관함수와 표본편자기상관함수가 정규분포를 따른다는 사실을 이해해야한다. 적어도 통계 전공자라면 한 번은 제대로 공부하는 것을 추천한다. ]
가령 바로 위의 oil.price에 대한 분석을 보자.- ar1 : ∣ϕ1∣=0.4574<0.2722×2=0.5444 이므로 유의하지 않다.
- ma1 : ∣θ1∣=0.2400<0.2722×2=0.5508 이므로 유의하지 않다.
- ma2 : ∣θ2∣=0.2563>0.0736×2=0.1472 이므로 유의하다.
- drift : ∣b∣=0.1812<0.1246×2=0.2492 이므로 유의하지 않다. 다시 말해 ARIMA(0,1,2) 모형에 θ1=0 이나 마찬가지고, 식으로 써보자면
∇yt=et+0.2563et−2
물론 이로써 분석이 끝났다고 할 수는 없다. 이는 아주 단순하게 판단한 것이고, 이보다는 좀 더 깊이 있게 데이터를 이해해서 제대로 된 결론을 얻어내야한다. 다만 결과를 보는 방법이 이러하다는 것일 뿐이다.