ランダムベクトルの二次形式で表された偏差平方和
公式
ランダムベクトル $\mathbf{X} = \left( X_{1} , \cdots , X_{n} \right)$ と 単位行列 $I_{n} \in \mathbb{R}^{n \times n}$ およびすべての成分が $1$ である一行列 $J_{n} \in \mathbb{R}^{n \times n}$ に対して、次が成り立つ。 $$ \mathbf{X}^{T} \left( I_{n} - {\frac{ 1 }{ n }} J_{n} \right) \mathbf{X} = ( n - 1 ) S^{2} $$ ここで $S^{2}$ は標本分散である。
導出
$$ \begin{align*} \overline{X} =& {\frac{ 1 }{ n }} \sum_{k=1}^{n} X_{k} \\ S^{2} =& {\frac{ 1 }{ n - 1 }} \sum_{k=1}^{n} \left( X_{k} - \overline{X} \right)^{2} \end{align*} $$ 標本平均 $\overline{X}$ と 標本分散 を上記のように置く。定理で与えられた $\left( I_{n} - J_{n} / n \right)$ は対角成分がすべて $1 - 1/n$ 、非対角成分がすべて $-1/n$ の対称行列であるため、ランダムベクトル二次形式となり、次のように表すことができる。 $$ \mathbf{X}^{T} \left( a_{ij} \right) \mathbf{X} = \sum_{i=1}^{n} a_{ii} X_{i}^{2} + \sum_{i \ne j} a_{ij} X_{i} X_{j} $$ 上式で $a_{ii} = 1 - 1/n$ と $a_{ij} = -1/n$ を代入すると次が得られる。 $$ \begin{align*} & \mathbf{X}^{T} \left( a_{ij} \right) \mathbf{X} \\ =& \sum_{i=1}^{n} \left( 1 - {\frac{ 1 }{ n }} \right) X_{i}^{2} + \sum_{i \ne j} \left( - {\frac{ 1 }{ n }} \right) X_{i} X_{j} \\ =& \sum_{i=1}^{n} X_{i}^{2} - {\frac{ 1 }{ n }} \sum_{i=1}^{n} X_{i}^{2} - {\frac{ 1 }{ n }} \sum_{i, j} X_{i} X_{j} \\ =& \sum_{i=1}^{n} X_{i}^{2} - {\frac{ 1 }{ n }} \sum_{i=1}^{n} X_{i}^{2} - {\frac{ 1 }{ n }} \sum_{i, j} X_{i} X_{j} \\ =& \sum_{i=1}^{n} X_{i}^{2} - {\frac{ 1 }{ n }} \sum_{i=1}^{n} X_{i} \sum_{i=1}^{n} X_{i} \\ =& \sum_{i=1}^{n} X_{i}^{2} - n \overline{X}^{2} \\ =& ( n - 1 ) S^{2} \end{align*} $$
■