logo

확장자기상관함수 📂통계적분석

확장자기상관함수

빌드업

PACF$AR(p)$의 차수를, ACF$MA(q)$ 의 차수를 정할 때 큰 도움이 된다. 하지만 $ARMA(p,q)$ 모형에 적용시킬 땐 아르마 모형의 가역성 때문에 $AR(p)$ 라도 $MA(\infty)$ 처럼 보일 수 있고, $MA(q)$ 라도 $AR(\infty)$ 처럼 보일 수 있다. 따라서 이러한 문제를 회피하고 아르마 모형을 찾기위한 여러가지 방법이 고안되었다.

정의

확장자기상관함수는 그 중의 한 방법으로, 다음과 같이 정의되는 $W_{t,k,j}$ 를 시차 $k$ 와 $j$ 에 대한 EACF라 한다. $$ W_{t,k,j} := Y_{t} - \tilde{\phi}_{1} Y_{t-1} - \cdots - \tilde{\phi}_{k} Y_{t-k} $$

설명

위의 정의만 가지고 EACF를 이해하는 것은 불가능하기 때문에 수식으로 이해해보자. 주어진 $k$, $j$ 에 대해서 아르마 모형 $ARMA(k,j)$ 는 다음과 같이 표현할 수 있다. $$ Y_{t} = \sum_{i = 1}^{k} \phi_{i} Y_{t-i} + e_{t} - \sum_{i = 1}^{j} \theta_{i} e_{t-i} $$ 여기서 $Y_{t}$ 를 $Y_{t-1} , \cdots , Y_{t-k}$ 로 다중회귀분석하면 $\phi_{1} , \cdots , \phi_{k}$ 의 추정치인 회귀계수 $\tilde{\phi}_{1} , \cdots , \tilde{\phi}_{k}$ 를 얻을 수 있다. 그리고 그 잔차는 다음과 같이 엉망진창으로 나타날 것이다. $$ Y_{t} - \sum_{i = 1}^{k} \tilde{\phi}_{i} Y_{t-i} = e_{t} - \sum_{i = 1}^{j} \theta_{i} e_{t-i} $$ 그런데 잘 생각해보면, 좌변을 위에서 정의한 $W_{t,k,j}$ 로 둠으로써 $MA(j)$ 모형을 얻을 수 있다. $$ W_{t,k,j} = e_{t} - \sum_{i = 1}^{j} \theta_{i} e_{t-i} $$ 그러면 $W_{t,k,j}$ 는 ACF가 그러했듯 정규분포 $\displaystyle N \left( 0 , {{1} \over {n - k - j}}\right)$ 를 따르고, 이를 이용해 가설검정을 한다.

위의 전개를 쉽게 말하자면 복잡하게 얽힌 아르마 모형 $ARMA(k,j)$ 에서 시차 $k$ 를 주어 $AR(k)$ 를 제거시키고, 거기서 시차 $j$ 를 주어 $MA(j)$ 만 생각해서 각개격파하는 것이다. $MA(j)$ 를 파악하기 위해서는 결국 ACF가 쓰여야하므로 확장자기상관함수라는 이름이 붙은 것은 적절하다고 할 수 있다.

실습

20190724\_150509.png

시차가 두 개의 축으로 나열되어 있으므로 ACFPACF와 달리 코릴로그램은 그릴 수 없고1 위와 같이 O와 X로 귀무가설을 기각했냐 못했느냐만 나타내는 테이블을 사용한다. 단, 이 테이블은 실제 데이터에서 얻은 것이 아니라 분석이 잘 되는 $ARMA(1,1)$ 모형에 대해 분석을 했을 때 나와야할 이론적인 도식일 뿐이다. 실제로 저렇게까지 깔끔하게 나와주는 경우는 거의 없다.

테이블을 읽는 법은 다음과 같다:

  • Step 1. 왼쪽 위에서 오른쪽 수평으로 이어지는 선이 있는 꼭짓점을 찾는다.
  • Step 2. 꼭짓점에서 오른쪽 아래로 떨어져서 수평선과 예각을 이루는 선을 찾는다.
  • Step 3. 두 선을 찾았다면, 꼭짓점에 해당하는 $ARMA(p,q)$ 로 분석을 해본다.

위와 같은 방법에 따르면 저 그림에서는 꼭짓점 O*에 해당하는 $ARMA(1,1)$ 가 모형의 후보가 된다. 시계열을 어느정도 똑바로 공부했고 설명을 잘 읽었다면 짐작할 수 있겠지만, 실제 분석에선 상당히 주관적이고 애매한 경우가 많다. 이에 대해선 실제로 분석을 많이 해보면서 익숙해지는 방법밖에 없다.

같이보기


  1. 사실 3차원에서 그릴 수 있긴한데 보기 불편해서 쓰지 않는다. 분석자는 신뢰구간을 벗어나느냐 벗어나지 않느냐만 확인하면 충분하다. ↩︎