R 에서 데이터 표준화하기 표준화된 잔차 보기
코드
R 은 통계에 특화된 언어인만큼 Z-score $\displaystyle z:= {{x - \mu} \over {\sigma}}$ 를 구해야할 일이 많다. 이 때 내장된 scale()
함수를 사용하면 편리하다.
예제로써 $\mathbf{x} = ( 1, \cdots , 10 )$ 이라는 벡터를 표준화해보자.
center(평균)나 scale(표준편차)과 같이 지저분하게 뜨는 게 보기 싫다면 그냥 벡터를 취하면 된다.
한편 표준화를 가장 많이 하게 되는 일 중 하나가 회귀분석 후 잔차 그림을 볼 때다. 물론 R 에 어느정도 익숙하다면야 별로 어렵지 않게 표준화된 잔차를 확인할 수 있지만, rstudent()
함수를 사용하면 단 한 줄만에 원하는 결과를 얻을 수 있다.
실제로 위의 표준화된 잔차를 그림으로 나타내면 다음과 같다.
x<-1:10; x
z<-scale(x); z
c(z)
out<-lm(rating~.,data=attitude)
rstudent(out)
win.graph(); plot(rstudent(out),main='정규화된 잔차그림')