logo

サタスウェイトの近似 📂数理統計学

サタスウェイトの近似

ビルドアップ

自由度rkr_{k}カイ二乗分布に従う独立したnn個の確率変数Ykχrk2Y_{k} \sim \chi_{r_{k}}^{2}があるとしよう。よく知られているように、これらの和k=1nYk\sum_{k=1}^{n} Y_{k}は自由度がk=1nrk\sum_{k=1}^{n} r_{k}のカイ二乗分布に従う。この洞察はt-分布に従うWV/r\displaystyle {{W} \over {\sqrt{V / r}}}の分母を見るときに、特に役立つが、残念ながら、プールドサンプル、つまり異質な母集団が混ざっている場合にそのまま適応するのは難しい。例えば、そうして選ばれたサンプルたちの比率、もっと一般的には重みa1,,anRa_{1} , \cdots , a_{n} \in \mathbb{R}が与えられている場合、 k=1nakYk \sum_{k=1}^{n} a_{k} Y_{k} の分布を把握するのはかなり難しい。カイ二乗分布に従っているようだが、その自由度を具体的に知るのが難しいのだ。これに対し、サタースウェイトsatterthwaiteakYk\sum a_{k} Y_{k}がカイ二乗分布に従うという仮定の下、かなりまともな統計量を提案した。サタースウェイト近似の代表的な応用は小標本での二つの母平均の差に関する仮説検定である。

k=1,,nk = 1, \cdots , nについてYkχrk2Y_{k} \sim \chi_{r_{k}}^{2}であり、akRa_{k} \in \mathbb{R}とする。あるν>0\nu > 0に対して k=1nakYkχν2ν \sum_{k=1}^{n} a_{k} Y_{k} \sim {{ \chi_{\nu}^{2} } \over { \nu }} と仮定すると、以下のν^\hat{\nu}を推定量として使用することができる。 ν^=(kakYk)2kak2rkYk2 \hat{\nu} = {{ \left( \sum_{k} a_{k} Y_{k} \right)^{2} } \over { \sum_{k} {{ a_{k}^{2} } \over { r_{k} }} Y_{k}^{2} }}

導出1

モーメント法

まずモーメント法から始める。

k=1nakYkχν2ν \sum_{k=1}^{n} a_{k} Y_{k} \sim {{ \chi_{\nu}^{2} } \over { \nu }} カイ二乗分布χν2\chi_{\nu}^{2}の平均が ν\nu なので Ek=1nakYk=1 \begin{equation} E \sum_{k=1}^{n} a_{k} Y_{k} = 1 \label{1} \end{equation} である。一方でYkY_{k}はそれぞれEYk=rkE Y_{k} = r_{k}であり、E(χν2/ν)=1E \left( \chi_{\nu}^{2} / \nu \right) = 1なので11次のモーメントから 1=E(k=1nakYk)=k=1nakEYk=k=1nakrk \begin{align*} 1 =& E \left( \sum_{k=1}^{n} a_{k} Y_{k} \right) \\ =& \sum_{k=1}^{n} a_{k} E Y_{k} \\ =& \sum_{k=1}^{n} a_{k} r_{k} \end{align*} である。χν2\chi_{\nu}^{2}の平均はν\nuで、分散は2ν2\nuなので22次のモーメントから E[(k=1nakYk)2]=E[(χν2ν)2]=1ν2E[(χν2)2]=1ν2[2ν+ν2]=2ν+1 \begin{align*} E \left[ \left( \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} \right] =& E \left[ \left( {{ \chi_{\nu}^{2} } \over { \nu }} \right)^{2} \right] \\ =& {{ 1 } \over { \nu^{2} }} E \left[ \left( \chi_{\nu}^{2} \right)^{2} \right] \\ =& {{ 1 } \over { \nu^{2} }} \left[ 2\nu + \nu^{2} \right] \\ =& {{ 2 } \over { \nu }} + 1 \end{align*} である。これをν\nuに関して整理すると、次の推定量が得られる。 ν^=2(k=1nakYk)21 \hat{\nu} = {{ 2 } \over { \left( \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} - 1 }} これはかなりまともな推定量だが、分母が(k=1nakYk)2\left( \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2}11に近づくときに発散したり、さらには負になる可能性があるというリスクがある。このリスクを克服するために、(k=1nakYk)2\left( \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2}をもう少し掘り下げてみよう。

補正

(1)\eqref{1}からEk=1nakYk=1E \sum_{k=1}^{n} a_{k} Y_{k} = 1だったので、分散の性質EZ2=VarZ+(EZ)2E Z^{2} = \Var Z + (EZ)^{2}に従って =2ν+1E[(k=1nakYk)2]=Var(k=1nakYk)+(Ek=1nakYk)2=(Ek=1nakYk)2[Var(k=1nakYk)(Ek=1nakYk)2+1]=12[Var(k=1nakYk)(Ek=1nakYk)2+1] \begin{align*} =& {{ 2 } \over { \nu }} + 1 \\ E \left[ \left( \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} \right] =& \Var \left( \sum_{k=1}^{n} a_{k} Y_{k} \right) + \left( E \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} \\ =& \left( E \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} \left[ {{ \Var \left( \sum_{k=1}^{n} a_{k} Y_{k} \right) } \over { \left( E \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} }} + 1 \right] \\ =& 1^{2} \cdot \left[ {{ \Var \left( \sum_{k=1}^{n} a_{k} Y_{k} \right) } \over { \left( E \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} }} + 1 \right] \end{align*} このように得た 2ν+1=Var(k=1nakYk)(Ek=1nakYk)2+1 {{ 2 } \over { \nu }} + 1 = {{ \Var \left( \sum_{k=1}^{n} a_{k} Y_{k} \right) } \over { \left( E \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} }} + 1 ν\nuに関して整理すると ν=2(Ek=1nakYk)2Var(k=1nakYk) \nu = {{ 2 \left( E \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} } \over { \Var \left( \sum_{k=1}^{n} a_{k} Y_{k} \right) }} である。分母のVar(k=1nakYk)\Var \left( \sum_{k=1}^{n} a_{k} Y_{k} \right)を直接計算するとVarYk=2(EYk)2/rk\Var Y_{k} = 2 \left( E Y_{k} \right)^{2} / r_{k}なので Var(k=1nakYk)=k=1nak2VarYk=k=1nak22(EYk)2rk=2k=1nak2(EYk)2rk \begin{align*} \Var \left( \sum_{k=1}^{n} a_{k} Y_{k} \right) =& \sum_{k=1}^{n} a_{k}^{2} \Var Y_{k} \\ =& \sum_{k=1}^{n} a_{k}^{2} {{ 2 \left( E Y_{k} \right)^{2} } \over { r_{k} }} \\ =& 2 \sum_{k=1}^{n} a_{k}^{2} {{ \left( E Y_{k} \right)^{2} } \over { r_{k} }} \end{align*} である。これをそのまま代入すると22が約分され、次の推定量が得られる。 ν^=(k=1nakYk)2k=1nak2(Yk)2rk \hat{\nu} = {{ \left( \sum_{k=1}^{n} a_{k} Y_{k} \right)^{2} } \over { \sum_{k=1}^{n} a_{k}^{2} {{ \left( Y_{k} \right)^{2} } \over { r_{k} }}}}


  1. Casella. (2001). Statistical Inference(2nd Edition): p314. ↩︎