다변량 데이터의 점도표
정의 1
다변량 데이터가 주어져 있다고 하자. 양적 데이터 두 개를 골라 하나는 수평축(x축), 하나는 수직축(y축)으로 두어 점을 찍은 그림을 점도표scatter Plot라 한다.
설명
다음은 걸그룹 ‘우주소녀’ 멤버들의 생년과 신장을 기록한 다변량 데이터다. 흔히 두 변수 사이에 상관관계가 있는지 확인하기 위해 점도표를 그려 확인해볼 수 있다.
데이터과학에서 점도표가 중요한 이유는 그것이 어떤 데이터든 그 본격적인 분석에 앞서 탐색적 데이터 분석exploratory Data Analysis이 동반되어야 하며, 그때 빼놓을 수 없는 것이 점도표기 때문이다.
같이보기
- R에서 점도표 그리기: 실제로 통계분석에 특화된 프로그래밍 언어 R에서는 그림을 그리는 함수
plot()
이 기본적으로 점도표를 그린다.
Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p102. ↩︎