logo

시계열 분석에서의 가치 모형 📂통계적분석

시계열 분석에서의 가치 모형

모델 1

가치 모델은 아치 모델을 일반화한 것으로, 이분산성을 파악하기 위한 시계열 분석법이다. $$ (1 - \beta{1} B - \cdots - \beta_{p} B^p) \sigma_{t | t-1}^2 = \omega + (\alpha_{1} B + \cdots + \alpha_{q} B^q) r_{t}^{2} $$

유도

유도는 가장 간단한 $ARCH(1)$ 모델부터 시작해보자.

2 시계열 데이터 $\left\{ p_{t} \right\}$ 의 리턴 $\left\{ r_{t} \right\}$ 이 주어져 있다고 할 때 데이터가 시차 $1$ 의 아치 이펙트, 즉 자기 회귀 조건부 이분산성을 가진다는 말은 다음과 같이 수식으로 나타낼 수 있다. $$ r_{t} = \sigma_{t | t-1} \varepsilon_{t} $$

$$ \begin{align} \sigma_{t | t-1}^2 = \omega + \alpha r_{t-1}^{2} \end{align} $$ 여기서 $\alpha$ 와 $\omega$ 는 아직 모르는 계수고, $\varepsilon_{t}$ 은 딱히 백색 잡음으로 가정될 필요 없이 평균이 $0$, 분산이 $1$ 로 가정되는 iid 프로세스 이노베이션innovation이다. $\sigma_{t | t-1}^2$ 는 $p_{t}$ 의 조건부 변동성conditional Volatility라고 부르며, 다음의 수식전개에 따라 리턴의 제곱 $r_{t}^2$ 은 $\sigma_{t | t-1}^2$ 의 불편추정량이 된다. $$ \begin{align*} E \left( r_{t}^2 | r_{t-j} , j = 1,2, \cdots \right) =& E \left( \sigma_{t | t-1}^2 \varepsilon_{t}^2 | r_{t-j} , j = 1,2, \cdots \right) \\ =& \sigma_{t | t-1}^2 E \left( \varepsilon_{t}^2 | r_{t-j} , j = 1,2, \cdots \right) \\ =& \sigma_{t | t-1}^2 E \left( \varepsilon_{t}^2 \right) \\ =& \sigma_{t | t-1}^2 \end{align*} $$ $r_{t}^{2}$ 가 $\sigma_{t | t-1}^2$ 의 불편추정량이라는 것은 $\eta_{t} := r_{t}^{2} - \sigma_{t | t-1}^2$ 이라고 두었을 때 $(1)$ 에 $\eta_{t}$ 를 대입함으로써 $\left\{ r_{t}^{2} \right\}$ 에 대한 자기상관모델 $AR(1)$ 을 얻을 수 있다는 뜻이다. $$ \left( r_{t}^{2} \right) = \omega + \alpha \left( r_{t-1}^{2} \right) + \eta_{t} $$ 여기서 $r_{t}$ 가 어떤 상수 모분산 $\sigma^2$ 을 가진다고 가정하고 양변에 기대값을 취하면 $$ \begin{align} \sigma^2 = \omega + \alpha \sigma^2 \end{align} $$ 을 얻는다. 여기서 갑자기 $\sigma$ 가 나왔다고 헷갈리면 안 되는 게, 첨자 없는 $\sigma$ 는 원래의 시계열 데이터 $p_{t}$ 의 모분산이 아니라 그 리턴인 $r_{t}$ 의 모분산이다. $E (r_{t}) = E (\sigma_{t | t-1} \varepsilon_{t} ) = 0$ 이므로 $$ \begin{align*} \sigma =& \text{var} (r_{t}) \\ =& E(r_{t}^{2}) - E(r_{t})^2 \\ =& E(r_{t}^{2}) \end{align*} $$ 와 같이 계산 되는 것이다. 적어도 $ARCH(1)$ 모델에서 $p_{t}$ 는 이분산성을 갖는 게 당연하다. $(2)$ 에 따르면 $\displaystyle \omega = \sigma^2 \left( 1 - \alpha \right)$ 이므로 $\sigma_{t | t-1}^2$ 에 대해 $(1)$ 를 풀어헤쳐보면 $$ \begin{align*} \sigma_{t | t-1}^2 =& \omega + \sigma r_{t}^{2} \\ =& (1 - \alpha) \sigma^2 + \alpha r_{t}^{2} \end{align*} $$ 즉 $\sigma_{t | t-1}^2$ 는 $\sigma^2$ 와 $r_{t}$ 의 가중평균으로 나타나며, $\alpha$ 가 $1$ 에 가까울수록 그 전 리턴 $r_{t}$ 에 영향을 크게 받고 $0$ 에 가까울수록 아치 이펙트가 없다는 말이 될 것이다. 그렇다면 분석은 $\omega$ 에 신경쓰지 않고 결국 $AR(1)$ 모형에서 계수 $\sigma$ 를 추정하는 문제로 귀결된다. 쉽게 말해, 아르마 모형의 재탕인 것이다.

일반화

아치 모델의 일반화도 같은 수순으로 하면 된다. $$ \sigma_{t | t-1}^2 = \omega + \beta_{1} \sigma_{t-1| t-2}^2 + \cdots + \beta_{p}\sigma_{t -p | t-p-1}^2 $$ 위는 $\sigma_{t | t-1}^2$ 의 자기회귀모형 $AR(p)$ 이 될 것이고, $$ \sigma_{t | t-1}^2 = \omega + \alpha_{1} r_{t-1}^2 + \cdots + \alpha_{q} r_{t-q}^2 $$ 위는 $\sigma_{t | t-1}^2$ 의 이동평균모형 $MA(q)$ 이 될 것이다. 이렇게 되면 $\sigma_{t | t-1}^2$ 에 대한 아르마 모형 $ARMA(p,q)$ 를 일반화된 아치모형 $GARCH(p,q)$ 로 불러볼 수 있을 것이다. 백쉬프트 오퍼레이터 $B$ 를 사용하면 한결 간단한 다음의 수식을 얻는다. $$ (1 - \beta{1} B - \cdots - \beta_{p} B^p) \sigma_{t | t-1}^2 = \omega + (\alpha_{1} B + \cdots + \alpha_{q} B^q) r_{t}^{2} $$ 개념적으로 가치 모델이 아르마 모델과 다름이 없다면 차수인 $p,q$ 를 찾는 방법도 다를 바가 없고, 마찬가지로 EACF를 사용해서 찾는 방법을 그대로 쓸 수가 있다.

한편 이제 변동성 군집현상을 조금 더 세련되게 정의할 수 있다. ‘분산이 커졌다 작아졌다 하는 현상’이라는 애매한 설명 대신, ‘데이터가 큰 차수의 가치 모형을 따를 때 변동성 군집현상이 있다고 한다’고 말할 수 있는 것이다.

같이보기


  1. Cryer. (2008). Time Series Analysis: With Applications in R(2nd Edition): p289. ↩︎

  2. 수식이 이해하기 쉽다는 뜻은 아니다. 오히려 가치 모델로 일반화할 때가 가장 쉽다. ↩︎