logo

질적자료의 도수 📂데이터과학

질적자료의 도수

정의 1

  1. 질적 데이터의 각 관측값이 나타나는 빈도수를 도수frequency라 한다.
  2. 도수를 전체 자료의 갯수로 나눈 것을 상대도수relative Frequency라 하고, 상대도수에 100을 곱한 값을 백분위precentage라 한다.
  3. 여러 범주에 각 도수 혹은 상대도수가 어떻게 분포되어 있는가를 나타내는 것을 도수 분포frequency distribution이라 한다.

설명

프리퀀시frequency는 흔히 물리학에서 주파수로 번역되지만, 통계학의 맥락에서는 말 그대로 해당 데이터가 얼마나 자주 발견되는가를 나타내는 수로써의 의미를 가진다. 다만 학술적 용어가 아닌 ‘빈도’라는 단어가 혼동을 줄 수 있어 빈 자를 떼고 그냥 도수라 부른다고 보면 된다.

말은 좀 어려운 척 적어놨지만 사실 그냥 ‘몇 번’이라는 뜻이다. 아주 간단한 예시로써 동전을 50번 튕겨서 앞면이 40번, 뒷면이 10번 나왔다면 그 각각의 도수는 40, 10이 되고 상대도수는 0.8, 0.2가 된다. 한편 상식적으로 생각했을 때 이 예시에서는 동전의 앞면이 수상할 정도로 많이 나왔다. 우리의 자연스러운 관심사는 이 동전이 과연 공평fair하냐는 점일 것이고, 도수 분포를 파악함으로써 통계적인 추론을 이어나가게 된다.

같이보기


  1. 경북대학교 통계학과. (2008). 엑셀을 이용한 통계학: p16. ↩︎