최소충분통계량
📂수리통계학최소충분통계량
정의
T(X) 가 충분통계량이라고 하자. 모든 다른 충분통계량 T′(X) 에 대해 T(x) 가 T′(x) 의 함수로 나타나면 T(X) 를 최소충분통계량minimal Sufficient statistic이라 한다.
정리
f(x;θ) 가 샘플 X 의 확률밀도함수 혹은 확률질량함수라 하자. 모든 실현 x,y 에 대해
f(y;θ)f(x;θ)=c(θ) is constant as function a of θ⟺T(x)=T(y)
를 만족하는 x 의 함수 T 가 존재한다면, T(X) 는 θ 에 대한 최소충분통계량이다.
설명
정의에서 T 가 다른 모든 T′ 의 무언가로 나타난다는 것은 상당히 수학다운 스테이트먼트다. T′ 가 마찬가지로 충분통계량인 어떤 T 로써 나타나지 않는다는 것은 T′ 가 T 에 비해 어딘가 부족함이 있다는 의미고, ‘모든’ T′ 에 대해서 성립해야한다는 점에서 ‘최소’라는 표현이 적절함을 알 수 있다.
예시
(충분통계량의 와닿는 예시에 이어)
X1,⋯,Xn∼U(0,θ) with f(x;θ)={10,if x∈(0,θ),otherwise=θ1I(0,θ)(x)
최대값의 모수가 θ 인 유니폼분포에서 얻은 랜덤 샘플을 생각해보면, 표본의 최대값 maxkXk=X(n) 이 θ 에 대한 충분통계량이 될 수 있었다. 직관적으로 봤을 때 이보다 좋은 충분통계량은 없어보이는데, 위 정리에 따라 실제로 확인해보자.
지시함수의 곱: i=1∏nI(−∞,θ](xi)=I(−∞,θ](i∈[n]maxxi)
x:=y:=(x1,⋯,xn)(y1,⋯,yn)
두 데이터 x,y 에 대해 조인트확률밀도함수의 비는 지시함수의 곱에 따라
f(y;θ)f(x;θ)===∏k=1nθ−1I(0,θ)(yk)∏k=1nθ−1I(0,θ)(xk)θ−nI(0,θ)(maxkyk)θ−nI(0,θ)(maxkxk)I(0,θ)(maxkyk)I(0,θ)(maxkxk)
이고, 이는 maxkxk=maxkyk 면 θ 와 무관하게 항상 같은 값이고 오직 그 경우에만 같은 값일 수 있다. 따라서 maxkxk 는 θ 에 대한 충분통계량일뿐만 아니라 최소충분통계량임을 보장할 수 있다.
증명
편의를 위해 f(x;θ)=0 인 경우는 생각하지 않아도 되도록 가정하자. 이하로는 X 의 치역을 X 라 하고, 모든 x∈X 와 θ 에 대해 f(x;θ)⪈0 이다.
Part 1. 충분성
T 에 대한 X 의 이미지를 T:=T(X) 와 같이 나타내고, 모든 t>0 에 대해 T 의 부분집합
At:={x∈X:T(x)=t}⊂T
를 정의함으로써 집합 T 의 분할을 생각할 수 있다. 각각의 t 마다 하나의 원소 xt∈At 를 잡고, xT(x) 를 각각의 ∀x∈X 에 대응하는 xt 라 나타내면 x∈At⟺xt∈At 이므로 T(x)=T(xT(x)) 다. 가정에서
f(y;θ)f(x;θ)=c(θ) is constant as function a of θ⟸T(x)=T(y)
이었으므로
h(x):=f(xT(x);θ)f(x;θ)
와 같이 정의된 함수 h:X→R 는 θ 에 대해서는 상수함수다. 이에 함수 g:T→R 를 g(t;θ):=f(xt;θ) 와 같이 정의하면 다음이 성립한다.
==f(x;θ)f(xT(x);θ)f(xT(x);θ)f(x;θ)g(T(x);θ)⋅h(x)
네이만 인수분해 정리: 랜덤 샘플 X1,⋯,Xn 이 모수 θ∈Θ 에 대해 같은 확률질량/밀도함수 f(x;θ) 를 가진다고 하자. 통계량 Y=u1(X1,⋯,Xn) 이 θ 의 충분통계량인 것은 다음을 만족하는 음이 아닌 두 함수 k1,k2≥0 이 존재하는 것이다.
f(x1;θ)⋯f(xn;θ)=k1[u1(x1,⋯,xn);θ]k2(x1,⋯,xn)
단, k2 는 θ 에 종속되지 않아야한다.
소인수분해 정리에 따라, T 는 θ 에 대한 충분통계량이다.
Part 2. 최소성
T 외의 충분통계량 T′ 을 생각해보면, 소인수분해 정리에 따라
f(x;θ)=g′(T′(x);θ)⋅h’(x)
를 만족시키는 두 함수 g′ 와 h′ 가 존재한다. x 과 y 가 T′(x)=T′(y) 를 만족시키는 임의의 두 실현이라고 하면
f(y;θ)f(x;θ)=g′(T’(y);θ)h’(x)g′(T’(x);θ)h’(x)=h’(y)h’(x)
는 θ 에 종속되지 않았으므로, 가정
f(y;θ)f(x;θ)=c(θ) is constant as function a of θ⟹T(x)=T(y)
에 따라 T(x)=T(y) 이다. 즉
T’(x)=T’(y)⟹T(x)=T(y)
이고, 어떤 함수 λ 에 대해
T(x)=λ(T’(x))
다. 따라서 T 는 T′ 의 함수고, T 는 최소충분통계량이다.
■