logo

コクランの定理の証明 📂数理統計学

コクランの定理の証明

定理

サンプル X=(X1,,Xn)\mathbf{X} = \left( X_{1} , \cdots , X_{n} \right)X1,,XniidN(0,σ2)X_{1} , \cdots , X_{n} \overset{\text{iid}}{\sim} N \left( 0, \sigma^{2} \right) のように iid正規分布 に従うとしよう。ランクrjr_{j}対称行列 A1,,AkRn×nA_{1} , \cdots , A_{k} \in \mathbb{R}^{n \times n} に対して 確率変数 Q1,,QkQ_{1} , \cdots , Q_{k}ランダムベクトル二次形式 Qi:=XTAiXQ_{i} := \mathbf{X}^{T} A_{i} \mathbf{X} のように表され、サンプルの二乗和が i=1nXi2=j=1kQj\sum_{i=1}^{n} X_{i}^{2} = \sum_{j=1}^{k} Q_{j} とすると、次が成立する。 j,Qjσ2χ2(rj)j1j2,Qj1Qj2    j=1krj=n \forall j , {\frac{ Q_{j} }{ \sigma^{2} }} \sim \chi^{2} \left( r_{j} \right) \land \forall j_{1} \ne j_{2} , Q_{j_{1}} \perp Q_{j_{2}} \iff \sum_{j=1}^{k} r_{j} = n 言い換えると、QjQ_{j} たちが互いに 独立 であり カイ二乗分布 χ2(rj)\chi^{2} \left( r_{j} \right) に従うことと 同値条件 は、ランク rjr_{j} たちの和がサンプルの大きさ nn と等しいということだ。

説明

この定理は F検定 が使用される 分散分析 を支える理論的基盤となる。

証明

(    )(\implies) QjQ_{j} たちが互いに独立で Qj/σ2χ2(rj)Q_{j} / \sigma^{2} \sim \chi^{2} \left( r_{j} \right) と仮定しよう。

確率変数の足し算: Xiχ2(ri)X_i \sim \chi^2 ( r_{i} ) ならば i=1nXiχ2(i=1nri) \sum_{i=1}^{n} X_{i} \sim \chi ^2 \left( \sum_{i=1}^{n} r_{i} \right)

Qj/σ2Q_{j} / \sigma^{2}自由度 rjr_{j} のカイ二乗分布に従うので、これらの確率変数の和は次のようなカイ二乗分布に従う。 j=1kQjσ2χ2(j=1krj) \sum_{j=1}^{k} {\frac{ Q_{j} }{ \sigma^{2} }} \sim \chi^{2} \left( \sum_{j=1}^{k} r_{j} \right)

標準正規分布からのカイ二乗分布の導出: XN(μ,σ2)X \sim N(\mu,\sigma ^2) ならば V=(Xμσ)2χ2(1) V=\left( { X - \mu \over \sigma} \right) ^2 \sim \chi ^2 (1)

X1,,XnX_{1} , \cdots , X_{n}正規分布 に従うので Xi2/σ2χ2(1)X_{i}^{2} / \sigma^{2} \sim \chi^{2} \left( 1 \right) であり、その和は次のようなカイ二乗分布に従う。 i=1nXi2σ2χ2(n) \sum_{i=1}^{n} {\frac{ X_{i}^{2} }{ \sigma^{2} }} \sim \chi^{2} \left( n \right)

大前提で i=1nXi2=j=1kQj\sum_{i=1}^{n} X_{i}^{2} = \sum_{j=1}^{k} Q_{j} だとしたので、n=j=1krjn = \sum_{j=1}^{k} r_{j} でなければならない。


(    )(\impliedby) j=1krj=n\sum_{j=1}^{k} r_{j} = n だと仮定しよう。

j=1kQj=XT(A1++Ak)X=XTX=i=1nXi2 \begin{align*} \sum_{j=1}^{k} Q_{j} =& \mathbf{X}^{T} \left( A_{1} + \cdots + A_{k} \right) \mathbf{X} \\ =& \mathbf{X}^{T} \mathbf{X} \\ =& \sum_{i=1}^{n} X_{i}^{2} \end{align*} i=1nXi2=j=1kQj\sum_{i=1}^{n} X_{i}^{2} = \sum_{j=1}^{k} Q_{j} ということは上記と同様なので、In=j=1kAjI_{n} = \sum_{j=1}^{k} A_{j} であることがわかる。ここで行列 Bj=InAjB_{j} = I_{n} - A_{j} と定義すると、BjB_{j}AjA_{j} 以外の残りの A1,,AkA_{1} , \cdots , A_{k} を足したものに等しい。

行列ランクの準加法性: 行列ランク準加法性 を持つ。すなわち、二つの行列 A,BA, B に対して次が成立する。 rank(A+B)rankA+rankB \rank \left( A + B \right) \le \rank A + \rank B

Rj0R_{j_{0}}Bj0B_{j_{0}} のランクとすれば、行列の和のランクは行列ランクの和以下であるため、次の不等式を得る。 Rj0=rankBj0rank(InAj0)=j=1krjrj0=nrj0 R_{j_{0}} = \rank B_{j_{0}} \le \rank \left( I_{n} - A_{j_{0}} \right) = \sum_{j=1}^{k} r_{j} - r_{j_{0}} = n - r_{j_{0}} しかし一方で In=Aj0+Bj0I_{n} = A_{j_{0}} + B_{j_{0}} なので nrj0+Rj0    nrj0Rj0n \le r_{j_{0}} + R_{j_{0}} \implies n - r_{j_{0}} \le R_{j_{0}} であり、正確には Rj0=nrj0R_{j_{0}} = n - r_{j_{0}} が成り立つ。

これは Bj0B_{j_{0}}Rj0=nrj0R_{j_{0}} = n - r_{j_{0}} 個の 00 ではない 固有値 を持っていることを意味する。Bj0B_{j_{0}} の固有値 λ\lambdadet(Bj0λI)=0\det \left( B_{j_{0}} - \lambda I \right) = 0 を満足し、Bj0=InAj0B_{j_{0}} = I_{n} - A_{j_{0}} なので次のように書き直すことができる。 det(InAj0λIn)=det(Aj0(1λ)In)=0 \det \left( I_{n} - A_{j_{0}} - \lambda I_{n} \right) = \det \left( A_{j_{0}} - \left( 1 - \lambda \right) I_{n} \right) = 0 したがって Aj0A_{j_{0}} の固有値は Bj0B_{j_{0}} の固有値と 11 ずつ差があり、Bj0B_{j_{0}}00 の固有値が正確に rj0r_{j_{0}} 個であったので、Aj0A_{j_{0}}11 の固有値を正確に rj0r_{j_{0}} 個持ち、残りはすべて 00 である。

固有値が 0011 しかない対称実数行列: 対称行列 ARn×nA \in \mathbb{R}^{n \times n}固有値 がすべて 0011 であるならば AA冪等行列 である。

正規分布ランダムベクトル二次形式のカイ二乗性の同値条件: サンプル X=(X1,,Xn)\mathbf{X} = \left( X_{1} , \cdots , X_{n} \right)X1,,XniidN(0,σ2)X_{1} , \cdots , X_{n} \overset{\text{iid}}{\sim} N \left( 0, \sigma^{2} \right) のように iid正規分布 に従うとしよう。ランクrnr \le n対称行列 ARn×nA \in \mathbb{R}^{n \times n} に対して ランダムベクトル二次形式Q=σ2XTAXQ = \sigma^{-2} \mathbf{X}^{T} A \mathbf{X} とすれば、次が成立する。 Qχ2(r)    A2=A Q \sim \chi^{2} (r) \iff A^{2} = A

すべての対称実数行列 A1,,AkA_{1} , \cdots , A_{k} は固有値が 0011 しかないため、冪等行列であり、ランクが rjr_{j} なので Qj/σ2Q_{j} / \sigma^{2} はカイ二乗分布 χ2(rj)\chi^{2} \left( r_{j} \right) に従う。

ホーグ-クレイグ定理: サンプル X=(X1,,Xn)\mathbf{X} = \left( X_{1} , \cdots , X_{n} \right)X1,,XniidN(0,σ2)X_{1} , \cdots , X_{n} \overset{\text{iid}}{\sim} N \left( 0, \sigma^{2} \right) のように iid正規分布 に従うとしよう。対称行列 A1,,AkRn×nA_{1} , \cdots , A_{k} \in \mathbb{R}^{n \times n} に対して 確率変数 Q1,,QkQ_{1} , \cdots , Q_{k}ランダムベクトル二次形式 Qi:=XTAiXQ_{i} := \mathbf{X}^{T} A_{i} \mathbf{X} のように表され、対称行列 AA と確率変数 QQ を次のように定義しよう。 A=A1++AkQ=Q1++Qk \begin{align*} A =& A_{1} + \cdots + A_{k} \\ Q =& Q_{1} + \cdots + Q_{k} \end{align*} もし Q/σ2Q / \sigma^{2}カイ二乗分布 χ2(r)\chi^{2} \left( r \right) に従い、i=1,,k1i = 1 , \cdots , k-1 に対して Qi/σ2χ2(ri)Q_{i} / \sigma^{2} \sim \chi^{2} \left( r_{i} \right) であり、Qk0Q_{k} \ge 0 であれば、Q1,,QkQ_{1} , \cdots , Q_{k}独立 であり、Qk/σ2Q_{k} / \sigma^{2} は自由度が rk=rr1rk1r_{k} = r - r_{1} - \cdots - r_{k-1} のカイ二乗分布 χ2(rk)\chi^{2} \left( r_{k} \right) に従う。

ホーグ-クレイグ定理によって Q1,,QkQ_{1} , \cdots , Q_{k} は互いに独立である。