n−11k=1∑n(Xk2−Xn)2→Pn1k=1∑n(Xk2−Xn)2→Pσ2⋯🤔?σ2⋯🤔!
간단한 예시로써 아래의 정리를 살펴보면, 사실 증명과정에서 표본분산Sn 의 분모는 자유도(n−1) 이 아닌 n 으로 정의되어도 일치추정량으로써는 문제가 없음을 알 수 있다. 이는 우리가 직관적으로 생각했을 때 ‘어차피 n 이 커지면 n 이나 (n−1) 이나 똑같지 않나?‘하는 고민을 수리적으로 설명하는 것과 같고, 다만 이 직관을 아래의 정리로 정당화하려면 모첨도의 존재성 정도는 필요하다는 점이 다르다.
정리
표본분산의 일치성
X1,⋯,Xn 가 확률분포(μ,σ2) 를 따르는 랜덤샘플, 즉 X1,⋯,Xn∼iid(μ,σ2) 이고 모첨도가 존재한다고 하면 표본분산Sn2 은 모분산σ2 의 일치추정량이다:
Sn→Pσ2as n→∞
연속 사상 정리는 학부 수준에서는 이해하기 어렵고 해석개론에서 말하는 연속함수의 성질과 비슷한 것이라 받아들이고 넘어가도 무방하다.
확률 수렴의 정의와 동치조건: 확률변수X 와 확률 변수의 시퀀스{Xn} 가 다음을 만족하면 n→∞ 일 때 Xn 이 X 로 확률 수렴convergence in Probability한다고 말하고, Xn→PX 와 같이 나타낸다.
∀ε>0,n→∞limP[∣Xn−X∣<ε]=1
수식에 쓰일 때는 동치이면서 더 편리한 다음의 표현을 더욱 즐겨쓴다.
∀ε>0,n→∞limP[∣Xn−X∣≥ε]=0
체비셰프 부등식: 확률변수 X 의 분산 σ2<∞ 가 존재하면 μ:=E(X) 와 어떤 양수 K>0 에 대해
P(∣X−μ∣≥Kσ)≤K21
정리의 전제에서 모첨도가 존재한다는 것은 X1 의 4차 적률E(X14)<∞ 이 존재한다는 것이므로, ∑Xk2 의 분산은 일반성을 잃지 않고 어떤 상수c2>0 에 대해 X1 의 표본분산의 모분산에 비례하는 c2σ4 로써 나타낼 수 있다. 식으로 다시 적어보면
n1k=1∑nXk2∼(E(X12),nc2σ4)
이고, 어떠한 ε>0 이 주어지든 체비셰프 부등식에 따라 어떤 양수 K:=nε/cσ2 가 존재해서
⟹⟹⟹∀ε>0,P(n1k=1∑nXk2−E(X12)≥Kcσ2)≤K21∀ε>0,P(n1k=1∑nXk2−E(X12)≥ε)≤n2ε2c2σ4∀ε>0,n→∞limP(n1k=1∑nXk2−E(X12)≥ε)=0n1k=1∑nXk2→PE(X12)
이다. 정리하면
Sn2=→Pn−1n[n1k=1∑nXk2−Xn2]1⋅[E(X12)−μ2]=σ2
이고, Sn2 는 모분산σ2 에 대한 일치추정량이다. 여기 n/(n−1)→1 이라는 부분에서, 사실 표본분산은 적당한 상수 a=n 에 대해 (n+a) 로 나뉘어도 일치추정량으로써 문제가 없다는 사실을 알 수 있다.
■
Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p298. ↩︎
Hogg et al. (2018). Introduction to Mathematical Statistcs(8th Edition): p325. ↩︎