일양분포의 충분통계량과 최대우도추정량
📂확률분포론일양분포의 충분통계량과 최대우도추정량
정리
일양분포를 따르는 랜덤샘플 X:=(X1,⋯,Xn)∼U(0,θ) 이 주어져 있다고 하자.
θ 에 대한 충분통계량 T 와 최대우도추정량 θ^ 는 다음과 같다.
T=θ^=k=1,⋯,nmaxXkk=1,⋯,nmaxXk
증명
전략: 일양분포의 충분통계량과 최대우도추정량은 그 실용성은 둘째치고 과제와 중간, 기말고사 때문에 수도 없이 봐야할 통계량이다. 정의에 의해서 직접 구할 수 있지만 이게 의외로 처음엔 쉽지가 않다.
로케이션 패밀리의 충분통계량과 최대우도추정량: 확률밀도함수가 fX(x;θ)=fX(x−θ) 인 로케이션 패밀리에서 얻은 랜덤샘플 X1,⋯,Xn∼X 이 주어져 있다고 하자. 충분통계량과 최대우도추정량은
- X 의 서포트가 위로 유계면 maxXk
- X 의 서포트가 아래로 유계면 minXk
에 종속된다.
U(0,θ) 는 로케이션 패밀리고, 로케이션 패밀리의 충분통계량과 최대우도추정량는 보조정리에 따라 쉽게 짐작할 수 있지만 직관적으로 이해하기 쉽게끔 직접 구해보자.
충분통계량
지시함수의 곱: i=1∏nI(−∞,θ](xi)=I(−∞,θ](i∈[n]maxxi)
f(x;θ)====k=1∏nf(xk;θ)k=1∏nθ1I[0,θ](xk)θn1I[0,θ](maxxk)θn1I[0,θ](maxxk)⋅1
네이만 인수분해 정리: 랜덤 샘플 X1,⋯,Xn 이 모수 θ∈Θ 에 대해 같은 확률질량/밀도함수 f(x;θ) 를 가진다고 하자. 통계량 Y=u1(X1,⋯,Xn) 이 θ 의 충분통계량인 것은 다음을 만족하는 음이 아닌 두 함수 k1,k2≥0 이 존재하는 것이다.
f(x1;θ)⋯f(xn;θ)=k1[u1(x1,⋯,xn);θ]k2(x1,⋯,xn)
단, k2 는 θ 에 종속되지 않아야한다.
네이만 인수분해 정리에 따라 T:=maxXk 는 θ 에 대한 충분통계량이다.
최대우도추정량
L(θ;x)=f(x;θ)=I[0,θ](maxxk)
랜덤샘플의 우도함수는 위와 같이 구해졌는데, 지시함수를 굳이 편미분해야할 필요가 없다.
최대우도추정량의 정의: 다음을 만족하는 추정량 θ^:=θ^(X) 를 최대우도추정량maximum Likelihood estimator, 줄여서 mle라 부른다.
θ^=argmaxL(θ;X)
최대우도추정량의 정의에 입각해서 생각해보면 우도함수를 생각할 것도 없이 θ^≥maxXk 기만 하면 되는데, 만약 θ^<maxXk 면 L=0 이기 때문이다. 이 설명과 정의에서 알 수 있듯 최대우도추정량은 딱히 maxXk 로 유일하지는 않고 유일할 필요도 없는데, 굳이 뜬금 없이 maxXk+700 를 생각할 이유가 없으니 maxXk 로 충분하다.
■