이항분포에서 근사시킨 정규분포의 분산 안정화

이항분포에서 근사시킨 정규분포의 분산 안정화

예시 1

$Y = Y_{n}$ 가 이항분포 $\text{Bin} (n,p)$ 를 따른다고 하면 $$ \arcsin \sqrt{ {{ Y } \over { n }} } \overset{D}{\to} N \left( \arcsin \sqrt{p} , n/4 \right) $$


설명

이항분포 $\text{Bin} (n, p )$ 는 $n \to \infty$ 일 때 정규분포 $N \left( np, np(1-p) \right)$ 로 수렴하므로 정규분포 자체는 신기할 게 없지만, 위와 같은 변환을 취함으로써 분산이 모수 $p$ 에 관계 없이 일정한 극한 분포를 얻을 수도 있다. 어디에 꼭 사용한다기보다도 수식적인 트릭이 재미있는데, 학부 1학년 이후로 볼 일 없을것 같았던 아크사인의 미분법이 쓰이기 때문이다.

$Y/n$ 에 $u$ 를 취한 $u ( Y/n )$ 의 분산이 $p$ 에 자유롭다고 가정하자. 충분히 큰 $n$ 에 대해 $Y/n \approx p$ 이므로 테일러전개하면 $$ u \left( {{ Y } \over { n }} \right) \approx u (p) + \left( {{ Y } \over { n }} - p \right) u' (p) $$

양변에 기대값을 취하면 $u (Y/n)$ 의 평균은 $u (p)$, 분산은 그 성질 $\text{Var} (aX + b) = a^{2} \text{Var} (X)$ 에 의해 $$ \left[ u' (p) \right]^{2} {{ p ( 1 - p ) } \over { n }} $$

이 분산이 $p$ 에 자유로워지려면 $u' (p)$ 의 제곱이 분자에 있는 $p ( 1 - p)$ 와 약분되도록 하면 된다. 따라서 어떤 상수 $c$ 에 대해 $$ u ‘(p) = {{ du(p) } \over { dp }} = {{ c } \over { \sqrt{ p ( 1 - p )} }} $$ 라고 두면 $u(p)$ 의 분산에서 $p$ 이 사라진다. 이 미분 방정식의 해는 아크사인함수의 미분법으로 바로 구할 수 있다.

역삼각함수의 미분법: $$ \left( \arcsin x \right)’ = {{ 1 } \over { \sqrt{1-x^{2}} }} $$

미분방정식의 해는 다음과 같고, 분모가 조금 달라보이겠지만 검산해보면 $\sqrt{p}$ 의 미분 때문에 정확히 맞아떨어진다. $$ u (p) = 2c \arcsin \sqrt{p} $$ $c$ 가 무엇이든 미분방정식을 똑같이 세우고 똑같이 풀 수 있으므로 무엇이 되든 상관 없지만, 보기에 깔끔하도록 $c = 1/2$ 라 두면 예시 에서 소개한 모양새가 된다.


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p318. ↩︎

댓글