시계열분석에서의 백색잡음

시계열분석에서의 백색잡음

정의 1

iid한 확률변수 $e_{t}$ 들의 수열 $\left\{ e_{t} \right\}_{t = 1}^{\infty}$ 를 백색잡음White Noise이라고 한다.


설명

확률변수의 수열이라는 정의에 따르면 당연히 확률과정이다. 특히 $E ( e_{t} ) = 0$ 이면 $Y_{t} : = \begin{cases} e_{1} & , t=1 \\ Y_{t-1} + e_{t} & , t \ne 1 \\ \end{cases}$ 과 같이 정의된 확률과정 $\left\{ Y_{t} \right\}_{t = 1}^{\infty}$ 는 랜덤워크가 된다.

통계학에선 관심을 가지는 현상에 대해 100% 완벽한 설명은 할 수 없다는 점을 인정한다. 애초에 완벽하게 설명할 수 있는 문제였다면 통계학으로 해결할 필요도 없었을 것이다. 그 어떤 모형을 세우든 오차는 생길 수 밖에 없는데, 통계학은 이를 ‘정보가 부족한 것’으로 받아들인다. 그냥 정보가 많으면 좋겠지만, 삼라만상의 모든 정보를 알 수는 없을 뿐더러 실제로 사용할 땐 비용의 문제도 따른다.

그런 의미에서 백색잡음은 시계열분석에서 발생하는 ‘어쩔 수 없는 오차’로 볼 수 있다. 이상적으로 만들어진 데이터가 아니라 현실 속에서 얻은 데이터인 이상 반드시 있다. 처음에는 무시할 수 있을만큼 작을지 몰라도 시간이 흐름에 따라 쌓이다보면 어느새 꽤 커져있을지도 모르는 일이다. 따라서 시계열분석에서의 예측은 먼 미래로 갈수록 그 신뢰구간이 넓어지며 그 의미를 잃어간다.

같이보기


  1. Cryer. (2008). Time Series Analysis: With Applications in R(2nd Edition): p17. ↩︎

댓글