logo

모형진단으로 확인하는 잔차의 독립성 📂통계적분석

모형진단으로 확인하는 잔차의 독립성

진단법

직관적 패턴 파악

표준화 잔차 그림을 통해 회귀분석이 제대로 되었는지 확인할 수가 있다. 독립성을 확인하려면 잔차 그림에 어떤 뚜렷한 경향이 나타나지 않으면 된다. 안타깝게도 독립성의 진단은 다른 회귀분석의 가정에 비해 매우 주관적일 수밖에 없다.

20180901\_105407.png 독립성이 결여된 예로 가장 자주볼 수 있는 경우는 위와 같이 정체를 알 수 없는 직선이 보이는 것이다. 물론 우연일수도 있지만, 보통은 데이터를 이해하지 못했거나 핵심적인 데이터가 빠져있을 때 나타나는 현상이다.

20180901\_105415.png

위와 같은 경우는 언뜻 아무 문제가 없어보이지만 잘 뜯어보면 $9$ 개를 주기로 같은 패턴이 반복되고 있다. 이정도로 노골적으로 규칙성이 나타나고 있다면 자신있게 독립성이 결여되어 있다고 말해도 좋다. 이럴 때 잔차들은 자기상관성Autocorrelation을 가진다고 하며, 시계열을 포함한 분석을 고려하는 것이 좋다.

통계적 검정

이런 문제는 분석자 스스로가 이런 데이터를 보는 눈썰미가 안 좋다고 생각해서 더빈-왓슨 검정을 사용했다면 쉽게 발견할 수 있다. 문제는 그렇다고 해서 더빈-왓슨 검정을 전적으로 신뢰해서는 안 된다. 더빈-왓슨 검정은 어디까지나 자기상관성을 파악할 뿐 독립성 자체에 대해선 장담할 수 있는 것이 없기 때문이다. 아래 그림은 이해를 돕기 위해 아주 작위적으로 만들어낸 모습이지만, 꼭 이런 모양이 아니라도 더빈-왓슨 검정을 통과하면서 독립성이 결여된 예시는 얼마든지 있다.

20180901\_105439.png 그림에선 잔차가 $0$ 에 거의 정확히 걸친 경우 그 다음 두번도 $0$ 에 걸치지만, 첫 $0$ 이 언제 나타나는지까진 알 수 없다. 이런 경우 잔차의 독립성엔 심각한 문제가 있다고 말할 수 있지만, 자기상관성이 있다고 하기엔 너무 불규칙적이다. 이 역시 우연일 가능성은 있지만, 그것을 판단하는 것은 전적으로 분석자의 몫이라고 할 수 있다.

같이보기