편자기상관함수란 자기상관성을 파악하되, Yt 와 Yt−k 사이에 있는 Yt−1,⋯,Yt−(k−1) 의 영향을 제거하고 딱 둘 사이의 관계를 파악하려고 하는 것이다. 정의에서 갑자기 회귀분석이 튀어오고 복잡하게 생겼지만 실상은 단순하다. et 만 살펴보자. Yt 를 Yt−1,⋯,Yt−k+1 로 회귀분석한다는 것은 다음과 같은 식에 들어갈 β1,⋯,βk−1 를 구한다는 것이다.
Yt=β1Yt−1+⋯βk−1Yt−(k−1)+et
다시 적어보면
et=Yt−(β1Yt−1+⋯βk−1Yt−(k−1))
이는 et 이 Yt−1,⋯,Yt−(k−1) 으로 설명될 부분들이 제거되었다는 뜻이다. 마찬가지로 et−k 역시 Yt−1,⋯,Yt−(k−1) 으로 설명할 수 있을만한 부분은 다 제거되었기 때문에, cor(et,et−k) 을 계산한다는 것은 Yt−1,⋯,Yt−(k−1) 이 없어진 Yt 와 Yt−k 만의 상관관계를 보려고 하는 것이다. 다른 변수는 제쳐놓고 관심 있는 변수만을 신경쓴다는 점에서 ‘편’자기상관함수라는 이름은 적절함을 알 수 있다. [ NOTE: 아무리 개념이 단순하다고 해도 sPACF를 실제로 계산하는 건 꽤 어려웠는데, 레빈슨Levinson과 더빈Durbin이 제안한 메소드 덕에 그나마 ϕkk 를 재귀적으로 계산할 수 있게 된 것이다. ]
수식적 설명
수식적으로는 Yt 가 AR(p) 에서 나왔다고 생각해봤을 때 Yt=k=1∑pϕkYt−k+et 이므로 Yt−k 의 계수 ϕk 를 계산하기 위해 나머지 변수를 배제할 수 있어 AR(p) 모형을 찾는데에 유용하다.
sPACF ϕkk 는 PACF ϕkk 의 추정치고, Yt 가 AR(p) 모형에서 나왔다면 k>p 일 때 정규분포N(0,n1) 을 따른다. 수식으로 나타내보면
ϕkk∼N(0,n1)
인데, 이를 이용해 가설검정을 한다.
테스트
Yt=k=1∑pϕkYt−k+et 이 주어져있고, k=1,⋯,p 이라고 하자.
H0 : AR(0)⟺θk=0, 즉, Yt 는 자기회귀 모형을 따르지 않는다.
H1 : AR(k)⟺θk=0, 즉, Yt 는 시차 k 의 편자기상관관계를 가진다.
해석
귀무가설 하에서는 p=0 과 동시에 ϕkk∼N(0,n1) 을 가정하고 표준오차는 n1 가 된다. 따라서 유의수준α 에 대해서 가설검정을 하고 싶다면 ∣ϕk∣ 가 신뢰구간상한 nz1−α/2 을 넘기는지 확인하면 된다. 넘어가면 유의한 시차의 후보가 되고, 넘어가지 못하면 편자기상관관계가 없는 것으로 본다.
실습
ar1.s 데이터는 AR(1) 모델에서 나온 TSA 패키지의 샘플 데이터다. 실제 아리마 모형으로 분석할 때 역시 추정치의 절대값이 표준오차의 두 배가 넘는지를 기준으로 유의한 계수인지 파악한다.
한편 TSA 패키지의 acf() 함수를 사용하면 위와 같이 여러 k 에 대해 코릴로그램correlogram을 그려준다. 굳이 머릿속으로 계산할 것 없이, 선을 넘어가면 유의한 것으로 보고 넘어가지 않으면 유의하지 않은 것으로 보아도 좋다. 기본적으로 유의수준 5% 에서 계산된다.
편자기상관함수를 이용한 가설검정을 제대로 이해했는지 확인해보는 방법으로써 위와 같이 실제로 선을 직접 그어보는 것을 추천한다. R 에서는 고작 코드 한 줄이지만, 한 번이라도 직접 실행시켜봄으로써 ϕkk 가 정규분포를 따르며, 그 표준오차가 se(rk)=n1 으로 구해진다는 것을 받아들일 수 있다.