順序統計量
定理1
ランダムサンプル $X_{1} , \cdots , X_{n}$ がサポート $\mathcal{S} =(a,b)$ を持つ確率密度関数 $f(x)$ を有し、連続確率分布に従うとしよう。これらを大きさ順に並べた確率変数を $Y_{1} < \cdots < Y_{n}$ のように表すと、それらのジョイントとマージナル確率密度関数は次の通りである。
[1] ジョイント: $$ g \left( y_{1} , \cdots , y_{n} \right) = \begin{cases} n! f (y_{1}) \cdots f (y_{n}) &, a < y_{1} < \cdots < y_{n} < b \\ 0 & , \text{elsewhere} \end{cases} $$
[2] マージナル: $Y_{k}$ の累積密度関数を $F(y_{k})$ とすると、 $$ g (y_{k}) = \begin{cases} {{ n! } \over { (k-1)! (n-k)! }} \left[ F (y_{k}) \right]^{k-1} \left[ 1 - F(y_{k}) \right]^{n-k} f(y_{k}) & , a < y_{k} < b \\ 0 & , \text{elsewhere} \end{cases} $$
説明
一見、式が複雑に見えるかもしれないが、直感的な意味を理解すればそれほど難しくない。[1] のジョイント確率密度関数では $n$ 個の確率変数を順番に並べることで、順列で得られるケース数 $n!$ が表れ、[2] のマージナル確率密度関数では、$Y_{k}$ の一つと $ y_{k}$ より小さい $k-1$ 個の確率変数と大きい $n-k$ 個の確率変数を選ぶ組み合わせによって $\displaystyle {{ n! } \over { (k-1)! 1! (n-k)! }}$ が現れる。$\left\{ Y_{i} \right\}$ の順番に引数を配置すると、その形は次のようになる。 $$ g (y_{k}) = {{ n! } \over { (k-1)! 1! (n-k)! }} \left[ F (y_{k}) \right]^{k-1} f(y_{k}) \left[ 1 - F(y_{k}) \right]^{n-k} $$ 順序統計量とは、言葉そのものが順序が指定された状態の統計量を意味し、ランダムサンプルの確率分布を仮定することができる場合、最大値や第二、最小値、正確には中位の観測値が選ばれる確率などを知ることができる。要約 [2] によると、最小値と最大値の確率密度関数は、次の式によって直接計算することができる。 $$ Y_{1} = \min \left\{ X_{1} , \cdots , X_{n} \right\} \implies g_{1} (y_{1}) = n f(y_{1}) \left[ 1- F(y_{1}) \right]^{n-1} \\ Y_{n} = \max \left\{ X_{1} , \cdots , X_{n} \right\} \implies g_{n} (y_{n}) = n f(y_{n}) \left[ F(y_{n}) \right]^{n-1} $$ 実際の例としては、貯水池の水位を考えてみよう。もし土砂降りが降ってあふれたり、ダムが壊れたりしたら大変なことになる。水位は時系列データとして表現でき、年平均や標準偏差も計算可能だが、そのような統計は洪水を目前にした緊急時には役に立たない。しかし、最初から最高水位に注目すれば、貯水池の規模を決定し、建設するためのより安定的で合理的な根拠となり得る。‘貯水池があふれることはあまりないよね?‘と思うなら、既にポイントは伝わったも同然だ。あふれない理由は、既にこうした事を考慮しているからだ。
証明
[1] 2
戦略: 順列で $n!$ が出ることを知れば、もうそれで終わりに近い。
確率変数の変換: 変換された多変量確率変数 $Y = ( Y_{1} , \cdots , Y_{n} )$ のジョイント確率密度関数は次の通り。 $$ g(y_{1},\cdots,y_{n}) = \sum_{i=1}^{k} f \left[ w_{1i}(y_{1},\cdots , y_{n}) , \cdots , w_{ni}(y_{1},\cdots , y_{n}) \right] \left| J_{i} \right| $$
$X_{1} , \cdots , X_{n}$ が $Y_{1} , \cdots , Y_{n}$ に変換されるケース数は $n!$ であり、どのように変化しても$x_{i} = y_{j}$ の順番だけが変わるため、ヤコビアンは $\pm 1$ である。したがって、 $$ \begin{align*} g \left( y_{1} , \cdots , y_{n} \right) =& \sum_{i=1}^{n!} | \pm 1 | f (y_{1}) \cdots f (y_{n}) \\ =& n! f (y_{1}) \cdots f (y_{n}) \end{align*} $$
■
[2] 3
戦略: 同様に、$n$ 個の要素から $3$ 種を選ぶ組み合わせの数が $\displaystyle {{ n! } \over { a! b!(n-a-b)! }}$ であることを知れば、もうそれでおしまい。ここで $a = k-1$, $b = 1$ とする。
$Y_{k}$ の一つと $ y_{k}$ より小さい $k-1$ 個の確率変数が $F(y_{k})$ の確率で、大きい $n-k$ 個の確率変数が $[1-F(y_{k})]$ の確率で選ばれるので、組み合わせの公式により、 $$ g (y_{k}) = {{ n! } \over { (k-1)! 1! (n-k)! }} \left[ F (y_{k}) \right]^{k-1} f(y_{k}) \left[ 1 - F(y_{k}) \right]^{n-k} $$
■