logo

最小十分統計量が与えられた偏りのない推定量の分散は最小化される 📂数理統計学

最小十分統計量が与えられた偏りのない推定量の分散は最小化される

定理 1

パラメーター θ\theta が与えられたとしよう。UU不偏推定量T1T_{1}十分統計量で、T2T_{2}最小十分統計量で以下のように U1:=E(UT1)U2:=E(UT2) \begin{align*} U_{1} :=& E \left( U | T_{1} \right) \\ U_{2} :=& E \left( U | T_{2} \right) \end{align*} 定義されると、以下が成立する。 VarU2VarU1 \operatorname{Var} U_{2} \le \operatorname{Var} U_{1}

説明

UU が不偏推定量であるため、T1T_{1} が与えられても T2T_{2} が与えられても、期待値で θ\theta を指すが、大雑把に言えば、最小十分統計量が与えられたとき、より揺れずに指すと受け止めていい。十分統計量の最小性から不偏推定量の分散の最小性が導かれると理解すると覚えやすい。

証明

最小十分統計量の定義: 十分統計量 T(X)T \left( \mathbf{X} \right) が、他のすべての十分統計量 T(X)T ' \left( \mathbf{X} \right) に対して T(x)T \left( \mathbf{x} \right)T(x)T ' \left( \mathbf{x} \right) の関数として表される場合、T(X)T \left( \mathbf{X} \right)最小十分統計量minimal Sufficient statisticと呼ばれる。

最小十分統計量の定義により、T2T_{2}T1T_{1} の関数として表されるので、 E(U1T2)=E(E(UT1)T2)=E(UT2)=U2 \begin{align*} E \left( U_{1} | T_{2} \right) =& E \left( E \left( U | T_{1} \right) | T_{2} \right) \\ =& E \left( U | T_{2} \right) \\ =& U_{2} \end{align*}

条件付き分散の性質: Var(X)=E(Var(XY))+Var(E(XY)) \operatorname{Var}(X) = E \left( \operatorname{Var}(X | Y) \right) + \operatorname{Var}(E(X | Y))

条件付き分散の性質に従って、U1U_{1}T2T_{2}に対して

VarU1=EVar(U1T2)+VarE(U1T2)=EVar(U1T2)+VarU2 \begin{align*} \operatorname{Var} U_{1} =& E \operatorname{Var} \left( U_{1} | T_{2} \right) + \operatorname{Var} E \left( U_{1} | T_{2} \right) \\ =& E \operatorname{Var} \left( U_{1} | T_{2} \right) + \operatorname{Var} U_{2} \end{align*}

となる。これは任意の十分統計量 T1T_{1} について成立するので、最小十分統計量 T2T_{2} が与えられた場合の不偏推定量 UU の期待値の分散は最小となる。


  1. Casella. (2001). Statistical Inference(2nd Edition): p305. ↩︎