logo

상관관계가 없다고 독립인 것은 아니다 📂통계적분석

상관관계가 없다고 독립인 것은 아니다

설명

독립이면 상관관계가 없지만, 상관관계가 없다고 독립인 것은 아니다.

상관관계가 없을 때 독립인 경우, 즉 필요충분조건이 되는 경우는 확률변수가 정규분포를 따를 때다.

1.png 왼쪽의 경우에 양의 상관관계, 오른쪽의 경우에 음의 상관관계가 있다고 한다. 그림의 cor상관계수로써, 두 변수가 얼마나 선형적인 관계를 가지는지를 나타내는 지표다. 독립일 경우에는 상관계수가 굉장히 낮게 계산되며, 두 변수가 상관관계를 가지지 않음을 알 수 있다. 여기서 중요한 것은 상관계수가 ‘선형 상관관계’에 대한 지표라는 점이다.

2.png

위와 같은 경우에서는 상관계수가 매우 낮게 나타나지만 분명히 어떤 관계가 있음을 짐작할 수 있다1.

다시 말해 독립은 아니라는 것인데, 상관계수는 어디까지나 선형 상관관계에 대한 지표기 때문에 이를 잡아내지 못한 것이다. 따라서 변수 간에 관계가 있는지 없는지 확인할때는 상관계수만 보고 덜컥 믿을 게 아니라 실제로 데이터를 보고 파악해야한다.


  1. Hadi. (2006). Regression Analysis by Example(4th Edition): p25. ↩︎