logo

統計学における順位の平均と分散 📂統計的検定

統計学における順位の平均と分散

定理 1

$n$ 個の 連続確率変数 $X_{1} , \cdots , X_{n}$ が iid と与えられているとする。各サンプルの ランク を $R \left( X_{1} \right) , \cdots , R \left( X_{n} \right)$ とすると、ランクが従う 確率分布離散一様分布 $U (1, n)$ であり $R$ の 期待値分散 は次の通りである。 $$ \begin{align*} E \left( R \right) =& {\frac{ n + 1 }{ 2 }} \\ \Var \left( R \right) =& {\frac{ n^{2} - 1 }{ 12 }} \end{align*} $$

証明

関数 としての ランク は $X_{k}$ のインデックス $k$ を順位に従った別の 自然数 に写す 順列 と見なせる。これは任意の自然数を同じ確率で選ぶのと変わらない。$R$ の 確率質量関数 は次の通りである。 $$ p(r) = {\frac{ 1 }{ n }} \qquad , r = 1 , \cdots , n $$

期待値

等差数列の和の公式: 初項が $a$ で公差が $d$ の等差数列 $a_{n} = a+(n-1)d$ に対して $$ \sum_{k=1}^{n} a_{k}= {{n \left\{ 2a + (n-1)d \right\} } \over {2}} $$

$$ \begin{align*} E \left( R \right) =& \sum_{r=1}^{n} r p(r) \\ =& {\frac{ n (n+1) }{ 2 }} {\frac{ 1 }{ n }} \\ =& {\frac{ n + 1 }{ 2 }} \end{align*} $$

分散

平方数の和の公式: $$ \sum_{k=1}^{n} { k^2} = {{n(n+1)(2n+1)} \over {6}} $$

$$ \begin{align*} \Var \left( R \right) =& \sum_{r=1}^{n} \left( r - E \left( R \right) \right)^{2} p(r) \\ =& {\frac{ 1 }{ n }} \sum_{r=1}^{n} \left( r - {\frac{ n + 1 }{ 2 }} \right)^{2} \\ =& {\frac{ 1 }{ n }} \sum_{r=1}^{n} \left( r^{2} - (n+1) r + {\frac{ (n+1)^{2} }{ 4 }} \right) \\ =& {\frac{ 1 }{ n }} \left[ {\frac{ n (n+1) (2n+1) }{ 6 }} - (n+1) {\frac{ n (n+1) }{ 2 }} + n {\frac{ (n+1)^{2} }{ 4 }} \right] \\ =& {\frac{ n+1 }{ 12 }} \left[ 2 (2n + 1) - 6 (n+1) + 3 (n+1) \right] \\ =& {\frac{ n+1 }{ 12 }} \left( n - 1 \right) \end{align*} $$


  1. Kruskal, W. H., & Wallis, W. A. (1952). Use of Ranks in One-Criterion Variance Analysis. Journal of the American Statistical Association, 47(260), 583–621. https://doi.org/10.1080/01621459.1952.10483441 https://medstatistic.ru/articles/Kruskal%20and%20Wallis%201952.pdf 3.1. Two Samples ↩︎