logo

아리마 모형에 대한 잔차분석 📂통계적분석

아리마 모형에 대한 잔차분석

설명

회귀분석과 마찬가지로 시계열 분석 역시 잔차분석을 한다. 아리마 모형의 가정에 따르면 잔차는 모두 백색 잡음이므로 선형성, 등분산성, 독립성, 정규성을 따르는지 확인은 할 것이다. 회귀분석과 비교하자면 전반적으로 그렇게까지 엄격하지는 않으나, 독립성 하나만큼은 철저하게 체크한다. 애초에 시계열분석 자체가 자기상관성을 파악하기 위한 것인데, 잔차에 아직 독립성이 결여되어있다면 분석이 덜 된 것이기 때문이다.

설명

R에서는 tsdiag() 함수로 간단하게 잔차분석을 할 수 있다.

6.png

예로써 내장데이터 WWWusage를 살펴보자. WWWusage는 먼 옛날 인터넷에 접속하는 이용자수를 나타내는 시계열 데이터다. 이에 대한 아리마 모형은 $ARIMA(1,1,1)$ 이고, 빨간색 실선은 그 적합치다. 모형을 그대로 tsdiag() 함수에 집어넣으면 다음과 같은 세 개의 플랏을 출력해준다.

7.png

  • (1) Standardized Residuals: 스캐터 플랏으로 표현되지 않았을 뿐 늘 보는 표준화잔차그림이다. 눈대중으로 선형성등분산성을 체크하면 된다.
  • (2) ACF of Residuals: 잔차로 ACF를 계산했을 때 어떤 관계가 나타나서는 곤란하다. 물론 자기자신과의 상관계수는 반드시 $\rho = 1$ 이므로 위의 그림엔 아무 이상이 없다고 단언할 수 있다.
  • (3) p values for Ljung-Box Statistics: 륭-박스 테스트를 시차 $k = 1, 2, \cdots$ 에 대해서 반복하고 그 p값을 점으로 찍어놓은 것이다. 아래에 있는 파란 실선 밑으로 내려가면 유의수준 $\alpha = 5 \%$ 에서 현재 사용한 아르마 모형 $ARMA(p,q)$ 가 적합하지 않다고 본다. 위의 그림으로 보아서는 분석이 잘 되었다고 말할 수 있다.
  • (4) 정규성 검정: 그림에도 없고 굉장히 중요한 것도 아니지만 여유가 있다면, 그리고 분석을 더 정확하게 하고싶다면 샤피로-윌크 테스트 혹은 하르케-베라 테스트를 사용해봄직하다. 사실 원래는 무조건 하는 게 맞지만, 실제 데이터 분석에선 이상치가 많아 정규성이 결여되는 경우가 잦아 생략도 많이 한다. 다행스럽게도 이 예제에선 다음과 같이 정규성도 만족하고 있다.

20190730\_133508.png

코드

library(TSA)
out<-arima(WWWusage,order=c(1,1,1)); out
win.graph(6,3); plot(WWWusage,main='WWWusage\'); lines(fitted(out),col='red')
win.graph(6,6); tsdiag(out)
shapiro.test(out$residuals)