logo

ノイマン因数分解定理の証明 📂数理統計学

ノイマン因数分解定理の証明

定理

random sample X1,,XnX_{1} , \cdots , X_{n} がパラメータ θΘ\theta \in \Theta に対して同じ確率質量/密度関数f(x;θ)f \left( x ; \theta \right) を持つとしよう。統計量 Y=u1(X1,,Xn)Y = u_{1} \left( X_{1} , \cdots , X_{n} \right)θ\theta十分統計量 であるのは、以下を満たす非負の関数 k1,k20k_{1} , k_{2} \ge 0 が存在する場合である。 f(x1;θ)f(xn;θ)=k1[u1(x1,,xn);θ]k2(x1,,xn) f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) = k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] k_{2} \left( x_{1} , \cdots , x_{n} \right) ただし、k2k_{2}θ\theta に依存してはならない。

証明

十分統計量の定義θΘ\theta \in \Theta に依存しない H(x1,,xn)H \left( x_{1} , \cdots , x_{n} \right) に対して f(x1;θ)f(xn;θ)fY1(u1(x1,,xn);θ)=H(x1,,xn) {{ f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) } \over { f_{Y_{1}} \left( u_{1} \left( x_{1} , \cdots, x_{n} \right) ; \theta \right) }} = H \left( x_{1} , \cdots , x_{n} \right) これが真である場合、Y1Y_{1}θ\theta のための 十分統計量sufficient statistic と呼ぶ。

連続確率分布に対してのみ証明する。離散確率分布に対する証明はCasellaを参照されたい。


()(\Rightarrow)

十分統計量の定義から fY1f_{Y_{1}}k1k_{1} に、HHf2f_{2} に該当するので自明である。


()(\Leftarrow)

y1:=u1(x1,,xn)y2:=u2(x1,,xn)yn:=un(x1,,xn) \begin{align*} y_{1} &:= u_{1} \left( x_{1} , \cdots , x_{n} \right) \\ y_{2} &:= u_{2} \left( x_{1} , \cdots , x_{n} \right) \\ &\vdots \\ y_{n} &:= u_{n} \left( x_{1} , \cdots , x_{n} \right) \end{align*}

便宜上、上記の関数の逆関数を以下のように置き、ヤコビアンJJ と表す。

x1:=w1(y1,,yn)x2:=w2(y1,,yn)xn:=wn(y1,,yn) \begin{align*} x_{1} &:= w_{1} \left( y_{1} , \cdots , y_{n} \right) \\ x_{2} &:= w_{2} \left( y_{1} , \cdots , y_{n} \right) \\ &\vdots \\ x_{n} &:= w_{n} \left( y_{1} , \cdots , y_{n} \right) \end{align*}

すると、Y1,,YnY_{1} , \cdots , Y_{n}結合確率密度関数 ggwi=wi(y1,,yn)w_{i} = w_{i} \left( y_{1} , \cdots , y_{n} \right) に対して g(y1,,yn;θ)=k1(y1;θ)k2(w1,,wn)J g \left( y_{1} , \cdots , y_{n} ; \theta \right) = k_{1} \left( y_{1} ; \theta \right) k_{2} \left( w_{1} , \cdots , w_{n} \right) \left| J \right| であり、Y1Y_{1}周辺確率密度関数 fY1f_{Y_{1}}fY1(y1;θ)=g(y1,,yn;θ)dy2dyn=k1(y1;θ)Jk2(w1,,wn)dy2dyn \begin{align*} f_{Y_{1}} \left( y_{1} ; \theta \right) =& \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} g \left( y_{1} , \dots , y_{n} ; \theta \right) d y_{2} \cdots d y_{n} \\ =& k_{1} \left( y_{1} ; \theta \right) \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} \left| J \right| k_{2} \left( w_{1} , \dots , w_{n} \right) d y_{2} \cdots d y_{n} \end{align*} k2k_{2}θ\theta に依存しない関数であり、JJθ\theta を含まないため、右辺の積分は y1y_{1} のみの関数として表すことができる。これを仮に m(y1)m \left( y_{1} \right) と表すと fY1(y1;θ)=k1(y1;θ)m(y1) f_{Y_{1}} \left( y_{1} ; \theta \right) = k_{1} \left( y_{1} ; \theta \right) m \left( y_{1} \right) ここで m(y1)=0m \left( y_{1} \right) = 0 であれば自明に fY1(y1;θ)=0f_{Y_{1}} \left( y_{1} ; \theta \right) = 0 である。今、m(y1)>0m \left( y_{1} \right) > 0 と仮定してみると、次のように書くことができる。 k1[u1(x1,,xn);θ]=fY1[u1(x1,,xn);θ]m[u1(x1,,xn)] k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] = {{ f_{Y_{1}} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] } \over { m \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) \right] }} 与えられた式に代入すると f(x1;θ)f(xn;θ)=k1[u1(x1,,xn);θ]k2(x1,,xn)=fY1[u1(x1,,xn);θ]m[u1(x1,,xn)]k2(x1,,xn)=fY1[u1(x1,,xn);θ]k2(x1,,xn)m[u1(x1,,xn)] \begin{align*} f \left( x_{1} ; \theta \right) \cdots f \left( x_{n} ; \theta \right) =& k_{1} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] k_{2} \left( x_{1} , \cdots , x_{n} \right) \\ =& {{ f_{Y_{1}} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] } \over { m \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) \right] }} k_{2} \left( x_{1} , \cdots , x_{n} \right) \\ =& f_{Y_{1}} \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) ; \theta \right] {{ k_{2} \left( x_{1} , \cdots , x_{n} \right) } \over { m \left[ u_{1} \left( x_{1} , \cdots , x_{n} \right) \right] }} \end{align*} k2k_{2}mm はどちらも θ\theta に依存しないので、定義によりY1Y_{1}θ\theta の十分統計量である。