수리통계학에서의 랜덤 샘플

수리통계학에서의 랜덤 샘플

정의 1

  1. 확률 변수 $X$ 가 실제로 뽑힌 것을 실현Realization이라 하고 보통 소문자 $x$ 로 나타낸다.
  2. 확률 변수 $X$ 와 같은 확률 분포에서 샘플 사이즈Sample Size $n$ 만큼 얻어낸 확률 변수들을 샘플Sample이라 하고 다음과 같이 나타낸다. $$ X_{1} , X_{2} , \cdots , X_{n} $$
  3. 확률 변수 $X_{1} , \cdots , X_{n}$ 이 iid면 사이즈 $n$ 의 랜덤 샘플이라 부른다.

설명

이러한 정의가 있음으로써 수리통계학은 실제 통계적 분석과의 접점을 가지게 된다. 랜덤 샘플의 실현을 다루는 것은 통계적 분석에 해당하며, 수리통계학은 그 데이터들을 어떻게 다룰지에 대한 커다란 등대가 되어준다. 관심을 가지는 데이터, 얻고 싶은 결론, 사용할 방법에는 차이가 있을지라도 그 아래에는 수리통계학이 이론적인 근간이 되어서 버텨줘야한다.

사실 수리통계학 교재를 벗어나면 실현Realization이라는 표현은 좀처럼 쓰이지 않으며, 보통은 그 실현을 그대로 부르는 말이 있다. 가령 랜덤 샘플의 실현은 값, 데이터, 관측치 등으로 부르는 식이다. 그러나 대문자일 땐 확률 변수, 소문자일 땐 데이터라는 컨벤션은 거의 모든 통계학 교재에서 따른다.


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p208. ↩︎

댓글