모형진단으로 확인하는 잔차의 등분산성
진단법 1
표준화 잔차 그림을 통해 회귀분석이 제대로 되었는지 확인할 수가 있다. 등분산성을 확인하려면 잔차들의 흩어진 모양이 전체적으로 고른지 확인하면 된다. 흔히 볼 수 있는 등분산성 결여의 예로써 다음의 두가지 경우가 대표적이다.
뒤로 갈수록 분산이 커지는 꼴인데, 이런 경우 변환이나 가중치를 도입함으로써 해결해야한다. 정말 쉽게 해결되느냐와는 별개로, 모형진단으로 발견한 문제 중에서는 가장 정석적이고 간단한 해결책이 있는 경우다.
가운데 부분만 말도 안되게 분산이 작은데, 데이터를 수집하는 단계에서부터 문제가 있는 것으로 의심할 수 있는 상황이다. 극단적인 차이를 정확하게 설명해줄 어떤 다른 변수가 있을 가능성이 높으므로 데이터셋부터 다시 한 번 검토해보는 게 좋다.
같이보기
Hadi. (2006). Regression Analysis by Example(4th Edition): p98. ↩︎