最小十分統計量
📂数理統計学最小十分統計量
定義
T(X)を十分統計量だとしよう。全ての別の十分統計量T′(X)に対して、T(x)がT′(x)の関数として表される場合、T(X)を最小十分統計量minimal Sufficient statisticと言う。
定理
f(x;θ)がサンプル Xの確率密度関数または確率質量関数だとしよう。全ての実現x,yに対して、
f(y;θ)f(x;θ)=c(θ) is constant as function a of θ⟺T(x)=T(y)
を満たすxの関数Tが存在する場合、T(X)はθに対する最小十分統計量である。
説明
定義でのTが他の全てのT′の何かとして表されるという声明は、かなり数学的な声明である。T′が同様に十分統計量でありながら、何らかのTによって表されないということは、T′がTに比べてどこか不足していることを意味し、「全ての」T′に対して成り立つ必要があるという点では「最小」という表現が適切であることが分かる。
例
(十分統計量のわかりやすい例の続き)
X1,⋯,Xn∼U(0,θ) with f(x;θ)={10,if x∈(0,θ),otherwise=θ1I(0,θ)(x)
最大パラメーターθの一様分布から得られたランダムサンプルを考えてみる。サンプルの最大値maxkXk=X(n)は、θに対する十分統計量になり得た。直感的に見て、これ以上の十分統計量はなさそうだが、上記の定理に従って実際に確認してみよう。
指示関数の積: i=1∏nI(−∞,θ](xi)=I(−∞,θ](i∈[n]maxxi)
x:=y:=(x1,⋯,xn)(y1,⋯,yn)
二つのデータx,yに対する結合確率密度関数の比は指示関数の積に基づいて
f(y;θ)f(x;θ)===∏k=1nθ−1I(0,θ)(yk)∏k=1nθ−1I(0,θ)(xk)θ−nI(0,θ)(maxkyk)θ−nI(0,θ)(maxkxk)I(0,θ)(maxkyk)I(0,θ)(maxkxk)
であり、これはmaxkxk=maxkykであればθに関係なく常に同じ値であり、その場合に限って同じ値である。従って、maxkxkはθに対する十分統計量であるだけでなく、最小十分統計量であることが保証される。
証明
便宜上、f(x;θ)=0の場合は考慮しなくても良いとする。ここからは、Xの値域をXとし、全てのx∈Xとθに対して、f(x;θ)⪈0だとする。
Part 1. 十分性
Tに対するXの像をT:=T(X)として表し、全てのt>0に対して、部分集合
At:={x∈X:T(x)=t}⊂T
を定義することにより、集合Tの分割を考えることができる。各tに対して、要素xt∈Atを一つ選び、xT(x)が各∀x∈Xに対応するxtとして表されると、x∈At⟺xt∈AtだからT(x)=T(xT(x))だ。前提から
f(y;θ)f(x;θ)=c(θ) is constant as function a of θ⟸T(x)=T(y)
なので
h(x):=f(xT(x);θ)f(x;θ)
として定義された関数h:X→Rは、θに対しては定数関数である。そこで、関数g:T→Rをg(t;θ):=f(xt;θ)として定義すれば、次が成立する。
==f(x;θ)f(xT(x);θ)f(xT(x);θ)f(x;θ)g(T(x);θ)⋅h(x)
ネイマン分解定理: ランダムサンプル X1,⋯,Xnがパラメーターθ∈Θに対して同じ確率質量/密度関数f(x;θ)を持つとする。統計量Y=u1(X1,⋯,Xn)がθの十分統計量であることは、以下を満たす非負の二つの関数k1,k2≥0が存在することを意味する。
f(x1;θ)⋯f(xn;θ)=k1[u1(x1,⋯,xn);θ]k2(x1,⋯,xn)
ただし、k2はθに依存してはならない。
ネイマン分解定理により、Tはθに対する十分統計量である。
Part 2. 最小性
T以外の十分統計量T′を考えると、ネイマン分解定理により、
f(x;θ)=g′(T′(x);θ)⋅h’(x)
を満たす二つの関数g′とh′が存在する。xとyがT′(x)=T′(y)を満たす任意の二つの実現について、
f(y;θ)f(x;θ)=g′(T’(y);θ)h’(x)g′(T’(x);θ)h’(x)=h’(y)h’(x)
はθに依存しないため、前提
f(y;θ)f(x;θ)=c(θ) is constant as function a of θ⟹T(x)=T(y)
によりT(x)=T(y)である。すなわち
T’(x)=T’(y)⟹T(x)=T(y)
であり、ある関数λに対して
T(x)=λ(T’(x))
である。従って、TはT′の関数であり、Tは最小十分統計量である。
■