logo

標準誤差の一般的な定義 📂数理統計学

標準誤差の一般的な定義

定義 1

ある推定量estimator TT について、TT標準偏差の推定値estimate標準誤差standard errorと言う。 s.e.(T):=Var(T)^ \text{s.e.} \left( T \right) := \sqrt{ \widehat{ \operatorname{Var} \left( T \right) } }

説明

定義で統計量ではなくて、正確に推定量と言われた理由がある。僕が当てたいパラメータ θ\theta と「合ってるかどうか」を議論する時じゃなければ、標準誤差は意味をなさないから、式でθ\theta が一度も登場しないにしても、わざわざ推定量について定義するんだ。だからTT の候補は明らかに標本平均 X\overline{X}回帰係数 βk\beta_{k} などで、その信頼区間が気になるからs.e.(T)\text{s.e.} \left( T \right) が必要になるんだ。

普通は、X=k=1nXk\overline{X} = \sum_{k=1}^{n} X_{k} の標準誤差 S/nS / \sqrt{n} をこのような定義から学んで、これだけが標準誤差だと思うことが多いけど、実際にはそれも定義ではなくて、計算を通じて得られる公式なんだ。できるだけ省略せずに計算してみよう。 s.e.(X)=Var(X)^=Var(1nk=1nXk)^=1n2Var(k=1nXk)^=iid1n2k=1nVar(Xk)^=1n2k=1nVar(Xk)^=1n2k=1nS2=1n2nS2=1nS2=1nS \begin{align*} \text{s.e.} \left( \overline{X} \right) =& \sqrt{ \widehat{ \operatorname{Var} \left( \overline{X} \right) } } \\ =& \sqrt{ \widehat{ \operatorname{Var} \left( {{ 1 } \over { n }} \sum_{k=1}^{n} X_{k} \right) } } \\ =& \sqrt{ \widehat{ {{ 1 } \over { n^{2} }} \operatorname{Var} \left( \sum_{k=1}^{n} X_{k} \right) } } \\ \overset{\text{iid}}{=} & \sqrt{ \widehat{ {{ 1 } \over { n^{2} }} \sum_{k=1}^{n} \operatorname{Var} \left( X_{k} \right) } } \\ =& \sqrt{ {{ 1 } \over { n^{2} }} \sum_{k=1}^{n} \widehat{ \operatorname{Var} \left( X_{k} \right) } } \\ =& \sqrt{ {{ 1 } \over { n^{2} }} \sum_{k=1}^{n} S^{2} } \\ =& \sqrt{ {{ 1 } \over { n^{2} }} n S^{2} } \\ =& \sqrt{ {{ 1 } \over { n }} S^{2} } \\ =& {{ 1 } \over { \sqrt{n} }} S \end{align*} 見ての通り、推定量estimatorと推定値estimateが違っていて、こんな簡単な例でもかなり混乱する。そこに、実際に標準誤差を使う多くの場面で、標本分散自由度で割ってルートを取る形を多用するから、その形を標準誤差そのものと間違えやすい。しかし、そのような直感がよく通じるとしても、標準誤差はそのような方法で決まるものではなく、上に示したような数式的な展開で導出するのが正しいんだ。


  1. Hadi. (2006). Regression Analysis by Example(4th Edition): p33. ↩︎