모형진단으로 확인하는 잔차의 정규성
진단법
표준화 잔차 그림을 통해 회귀분석이 제대로 되었는지 확인할 수가 있다.
정규성은 잔차들의 흩어진 모양보다는 히스토그램으로 확인하거나 정규성 검정을 하는 게 낫다.
왼쪽은 가운데에서 위 아래로 갈수록 그 밀도가 작아지는 것에 비해 오른쪽은 위아래 할 것 없이 고르게 퍼져있다.
하지만 이렇게 정말 잔차들이 정규분포 외의 알려진 분포를 따르는 케이스는 실제 분석에선 거의 찾아볼 수 없다.분석에서 정규성이 문제가 되는 경우는 대체로 이상치outlier 때문이다.
위 그림처럼 표본에 비해 지나치게 이상치가 많거나, 6~7을 육박할 정도로 말도 안되는 숫자가 나오는 경우 정규성에 문제가 생긴다. 이러한 이상치는 그냥 막무가내로 제거하면 되는 게 아니라 분석자가 일일이 데이터를 봐가면서 제대로 파악을 해야한다.