logo

順序統計量 📂数理統計学

順序統計量

定理1

ランダムサンプル X1,,XnX_{1} , \cdots , X_{n} がサポート S=(a,b)\mathcal{S} =(a,b) を持つ確率密度関数 f(x)f(x) を有し、連続確率分布に従うとしよう。これらを大きさ順に並べた確率変数を Y1<<YnY_{1} < \cdots < Y_{n} のように表すと、それらのジョイントとマージナル確率密度関数は次の通りである。

  • [1] ジョイント: g(y1,,yn)={n!f(y1)f(yn),a<y1<<yn<b0,elsewhere g \left( y_{1} , \cdots , y_{n} \right) = \begin{cases} n! f (y_{1}) \cdots f (y_{n}) &, a < y_{1} < \cdots < y_{n} < b \\ 0 & , \text{elsewhere} \end{cases}

  • [2] マージナル: YkY_{k} の累積密度関数を F(yk)F(y_{k}) とすると、 g(yk)={n!(k1)!(nk)![F(yk)]k1[1F(yk)]nkf(yk),a<yk<b0,elsewhere g (y_{k}) = \begin{cases} {{ n! } \over { (k-1)! (n-k)! }} \left[ F (y_{k}) \right]^{k-1} \left[ 1 - F(y_{k}) \right]^{n-k} f(y_{k}) & , a < y_{k} < b \\ 0 & , \text{elsewhere} \end{cases}

説明

一見、式が複雑に見えるかもしれないが、直感的な意味を理解すればそれほど難しくない。[1] のジョイント確率密度関数では nn 個の確率変数を順番に並べることで、順列で得られるケース数 n!n! が表れ、[2] のマージナル確率密度関数では、YkY_{k} の一つと yk y_{k} より小さい k1k-1 個の確率変数と大きい nkn-k 個の確率変数を選ぶ組み合わせによって n!(k1)!1!(nk)!\displaystyle {{ n! } \over { (k-1)! 1! (n-k)! }} が現れる。{Yi}\left\{ Y_{i} \right\} の順番に引数を配置すると、その形は次のようになる。 g(yk)=n!(k1)!1!(nk)![F(yk)]k1f(yk)[1F(yk)]nk g (y_{k}) = {{ n! } \over { (k-1)! 1! (n-k)! }} \left[ F (y_{k}) \right]^{k-1} f(y_{k}) \left[ 1 - F(y_{k}) \right]^{n-k} 順序統計量とは、言葉そのものが順序が指定された状態の統計量を意味し、ランダムサンプルの確率分布を仮定することができる場合、最大値や第二、最小値、正確には中位の観測値が選ばれる確率などを知ることができる。要約 [2] によると、最小値と最大値の確率密度関数は、次の式によって直接計算することができる。 Y1=min{X1,,Xn}    g1(y1)=nf(y1)[1F(y1)]n1Yn=max{X1,,Xn}    gn(yn)=nf(yn)[F(yn)]n1 Y_{1} = \min \left\{ X_{1} , \cdots , X_{n} \right\} \implies g_{1} (y_{1}) = n f(y_{1}) \left[ 1- F(y_{1}) \right]^{n-1} \\ Y_{n} = \max \left\{ X_{1} , \cdots , X_{n} \right\} \implies g_{n} (y_{n}) = n f(y_{n}) \left[ F(y_{n}) \right]^{n-1} 実際の例としては、貯水池の水位を考えてみよう。もし土砂降りが降ってあふれたり、ダムが壊れたりしたら大変なことになる。水位は時系列データとして表現でき、年平均や標準偏差も計算可能だが、そのような統計は洪水を目前にした緊急時には役に立たない。しかし、最初から最高水位に注目すれば、貯水池の規模を決定し、建設するためのより安定的で合理的な根拠となり得る。‘貯水池があふれることはあまりないよね?‘と思うなら、既にポイントは伝わったも同然だ。あふれない理由は、既にこうした事を考慮しているからだ。

証明

[1] 2

戦略: 順列で n!n! が出ることを知れば、もうそれで終わりに近い。


確率変数の変換: 変換された多変量確率変数 Y=(Y1,,Yn)Y = ( Y_{1} , \cdots , Y_{n} ) のジョイント確率密度関数は次の通り。 g(y1,,yn)=i=1kf[w1i(y1,,yn),,wni(y1,,yn)]Ji g(y_{1},\cdots,y_{n}) = \sum_{i=1}^{k} f \left[ w_{1i}(y_{1},\cdots , y_{n}) , \cdots , w_{ni}(y_{1},\cdots , y_{n}) \right] \left| J_{i} \right|

X1,,XnX_{1} , \cdots , X_{n}Y1,,YnY_{1} , \cdots , Y_{n} に変換されるケース数は n!n! であり、どのように変化してもxi=yjx_{i} = y_{j} の順番だけが変わるため、ヤコビアンは ±1\pm 1 である。したがって、 g(y1,,yn)=i=1n!±1f(y1)f(yn)=n!f(y1)f(yn) \begin{align*} g \left( y_{1} , \cdots , y_{n} \right) =& \sum_{i=1}^{n!} | \pm 1 | f (y_{1}) \cdots f (y_{n}) \\ =& n! f (y_{1}) \cdots f (y_{n}) \end{align*}

[2] 3

戦略: 同様に、nn 個の要素から 33 種を選ぶ組み合わせの数が n!a!b!(nab)!\displaystyle {{ n! } \over { a! b!(n-a-b)! }} であることを知れば、もうそれでおしまい。ここで a=k1a = k-1, b=1b = 1 とする。


YkY_{k} の一つと yk y_{k} より小さい k1k-1 個の確率変数が F(yk)F(y_{k}) の確率で、大きい nkn-k 個の確率変数が [1F(yk)][1-F(y_{k})] の確率で選ばれるので、組み合わせの公式により、 g(yk)=n!(k1)!1!(nk)![F(yk)]k1f(yk)[1F(yk)]nk g (y_{k}) = {{ n! } \over { (k-1)! 1! (n-k)! }} \left[ F (y_{k}) \right]^{k-1} f(y_{k}) \left[ 1 - F(y_{k}) \right]^{n-k}


  1. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p231. ↩︎

  2. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p231. ↩︎

  3. Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p232. ↩︎