logo

교차상관함수 📂통계적분석

교차상관함수

정의 1

{Xt}t=1n\left\{ X_{t} \right\}_{t=1}^{n}, {Yt}t=1n\left\{ Y_{t} \right\}_{t=1}^{n}확률과정이라고 하자.

  1. 다음과 같이 정의된 ρk\rho_{k} 를 시차 kk교차상관함수cross 라고 한다. ρk(X,Y):=cor(Xt,Ytk)=cor(Xt+k,Yt) \rho_{k} (X,Y) := \text{cor} \left( X_{t} , Y_{t-k} \right) = \text{cor} \left( X_{t+k} , Y_{t} \right)
  2. 다음과 같이 정의된 rkr_{k} 를 시차 kk표본교차상관함수라고 한다. rk:=(XtX)(YtkY)(XtX)2(YtkY)2 r_{k} := {{ \sum \left( X_{t} - \overline{X} \right) \left( Y_{t-k} - \overline{Y} \right) } \over { \sqrt{ \sum \left( X_{t} - \overline{X} \right)^2 } \sqrt{ \left( Y_{t-k} - \overline{Y} \right)^2 } }}

설명

교차상관함수는 두 시계열 데이터 간의 상관관계를 파악하기 위한 함수다. 시계열에 적용되었다는 점만 다를 뿐, 수식으로만 보았을 때는 피어슨 상관계수 그 자체다.

sCCF rkr_{k} 는 CCF ρk\rho_{k}추정치고, {Xt}t=1n\left\{ X_{t} \right\}_{t=1}^{n}, {Yt}t=1n\left\{ Y_{t} \right\}_{t=1}^{n}정상성을 가지면서 서로 독립이면 다음과 같이 정규분포를 따른다고 한다. rkN(0,1n[1+2k=1ρk(X,Y)]) r_{k} \sim N \left( 0 , {{ 1 } \over { n}} \left[ 1 + 2 \sum_{k=1}^{\infty} \rho_{k} ( X , Y) \right] \right) 이를 이용해 회귀분석처럼 가설검정을 할 수 있다.

테스트

Yt=et+k=0mβkXtk\displaystyle Y_{t} = e_{t} + \sum_{k=0}^{m} \beta_{k} X_{t-k} 이라고 하자.

  • H0H_{0} : βk=0\beta_{k} = 0 즉, XtX_{t}YtkY_{t-k} 는 상관관계를 가지지 않는다.
  • H1H_{1} : βk0\beta_{k} \ne 0 즉, XtX_{t}YtkY_{t-k} 는 상관관계를 가진다.

해석

귀무가설 하에서는 ρk(X,Y)=0\rho_{k} ( X , Y) = 0 과 동시에 N(0,1n)\displaystyle N \left( 0 , {{ 1 } \over { n }} \right) 을 가정하고 표준오차1n\displaystyle {{1} \over {\sqrt{n}}} 이 된다. 따라서 유의수준 α\alpha 에 대해서 가설검정을 하고 싶다면 rk| r_{k} | 가 신뢰구간상한 z1α/2n\displaystyle {{z_{1- \alpha/2}} \over {\sqrt{n} }} 을 넘기는지 확인하면 된다. 넘어가면 유의한 시차의 후보가 되고, 넘어가지 못하면 상관관계가 없는 것으로 본다.

같이보기


  1. Cryer. (2008). Time Series Analysis: With Applications in R(2nd Edition): p261~262. ↩︎