ウィルコクソンの符号順位検定
仮説検定
$n$ 個の ランダムサンプルが $\left\{ \left( X_{k} , Y_{k} \right) \right\}_{k=1}^{n}$ のように 順序対として与えられているとする。これらの差として定義される 確率変数 $Z_{k} = X_{k} - Y_{k}$ は、唯一の 母平均 かつ 母中央値 である $\theta$ を持つ連続確率分布に従い、その確率密度関数 $f(z)$ は $z = \theta$ に関して 対称な 関数であると仮定する1 2。 $\theta$ に対する次の 仮説検定を ウィルコクソンの符号付き順位検定Wilcoxon signed-rank testと呼ぶ。
- $H_{0} : \theta = 0$、二つの母集団の差はない。
- $H_{1} : \theta \ne 0$、二つの母集団の差がある。
検定統計量 3
指示関数 $I$、最小値 $\min$ と $Z_{k}$ の絶対値 $\left\{ \left| Z_{k} \right| \right\}_{k=1}^{n}$ におけるランク $R$ に対して次のような検定統計量 $T$ を定義する。 $$ \begin{align*} T^{+} &= \sum_{k=1}^{n} I \left( Z_{k} > 0 \right) R \left( \left| Z_{k} \right| \right) \\ T^{-} &= \sum_{k=1}^{n} I \left( Z_{k} < 0 \right) R \left( \left| Z_{k} \right| \right) \\ T =& \min \left( T^{+} , T^{-} \right) \end{align*} $$
説明
検定統計量の定義はやや複雑に見えるが、その過程を考えればそれほど難しくない:
- すべての $k = 1 , \cdots , n$ について $X_{k}$ と $Y_{k}$ の差を求める。
- $\left| Z_{k} \right| = \left| X_{k} - Y_{k} \right|$ を求めて順位をつける。
- 差が正の群と負の群に分けて $T^{+}$、$T^{-}$ を計算する。
- そのうち小さい方を $T$ として選ぶ。
計算過程は見方によっては マン・ホイットニー検定 と 符号検定 を混ぜたように見える。$Z_{k}$ の符号によって元々は区別されなかった $n = n_{1} + n_{2}$ 個のサンプルを分けてその順位和を計算する点がそれに当たる。実際に仮説検定もまたマン・ホイットニー検定と類似して別の表を使用する。
一方、教科書や論文によっては $T^{+}$ と $T^{-}$ のうちどちらを選ぶかの基準が異なることがあり、そもそも $T^{+}$ のみを計算する場合もあるが、式の上では実は $T^{+} + T^{-} = n \left( n + 1 \right) / 2$ であるため一方を知れば他方の情報もすべてわかってしまうに等しい。どの方式を選ぶかにより表は変わるが本質的な差はない。
Taheri, S.M., Hesamian, G. A generalization of the Wilcoxon signed-rank test and its applications. Stat Papers 54, 457–470 (2013). https://doi.org/10.1007/s00362-012-0443-4 ↩︎
Gwowen Shieh , Show-Li Jan & Ronald H. Randles (2007) Power and sample size determinations for the Wilcoxon signed-rank test, Journal of Statistical Computation and Simulation, 77:8, 717-724, DOI: 10.1080/10629360600635245 ↩︎
Mendenhall. (2012). Introduction to Probability and Statistics (13th Edition): p646. ↩︎