교차상관함수

교차상관함수

Ccf cross correlation functon

정의 1

$\left\{ X_{t} \right\}_{t=1}^{n}$, $\left\{ Y_{t} \right\}_{t=1}^{n}$ 이 확률과정이라고 하자.

  1. 다음과 같이 정의된 $\rho_{k}$ 를 시차 $k$ 의 교차상관함수라고 한다. $$ \rho_{k} (X,Y) := \text{cor} \left( X_{t} , Y_{t-k} \right) = \text{cor} \left( X_{t+k} , Y_{t} \right) $$
  2. 다음과 같이 정의된 $r_{k}$ 를 시차 $k$ 의 표본교차상관함수라고 한다. $$ r_{k} := {{ \sum \left( X_{t} - \overline{X} \right) \left( Y_{t-k} - \overline{Y} \right) } \over { \sqrt{ \sum \left( X_{t} - \overline{X} \right)^2 } \sqrt{ \left( Y_{t-k} - \overline{Y} \right)^2 } }} $$

설명

교차상관함수는 두 시계열 데이터 간의 상관관계를 파악하기 위한 함수다. 시계열에 적용되었다는 점만 다를 뿐, 수식으로만 보았을 때는 피어슨 상관계수 그 자체다.sCCF $r_{k}$ 는 CCF $\rho_{k}$ 의 추정치고, 정규분포 $\displaystyle N \left( 0 , {{ 1 } \over { n }} \left[ 1 + 2 \sum_{k=1}^{\infty} \rho_{k} ( X , Y ) \right] \right)$ 을 따른다. 수식으로 나타내보면 $$ r_{k} \sim N \left( 0 , {{ 1 } \over { n}} \left[ 1 + 2 \sum_{k=1}^{\infty} \rho_{k} ( X , Y) \right] \right) $$ 인데, 이를 이용해 회귀분석처럼 가설검정을 한다.

테스트

$\displaystyle Y_{t} = e_{t} + \sum_{k=0}^{m} \beta_{k} X_{t-k}$ 이라고 하자.

  • $H_{0}$ : $\beta_{k} = 0$ 즉, $X_{t}$ 와 $Y_{t-k}$ 는 상관관계를 가지지 않는다.
  • $H_{1}$ : $\beta_{k} \ne 0$ 즉, $X_{t}$ 와 $Y_{t-k}$ 는 상관관계를 가진다.

해석

귀무가설 하에서는 $\rho_{k} ( X , Y) = 0$ 과 동시에 $\displaystyle N \left( 0 , {{ 1 } \over { n }} \right)$ 을 가정하고 표준오차는 $\displaystyle {{1} \over {\sqrt{n}}}$ 이 된다. 따라서 유의수준 $\alpha$ 에 대해서 가설검정을 하고 싶다면 $| r_{k} |$ 가 신뢰구간상한 $\displaystyle {{z_{1- \alpha/2}} \over {\sqrt{n} }}$ 을 넘기는지 확인하면 된다. 넘어가면 유의한 시차의 후보가 되고, 넘어가지 못하면 상관관계가 없는 것으로 본다.

같이보기


  1. Cryer. (2008). Time Series Analysis: With Applications in R(2nd Edition): p261. ↩︎

댓글