多変量確率変数の変換 📂数理統計学

多変量確率変数の変換

公式

多変量確率変数 $X = ( X_{1} , \cdots , X_{n} )$ の結合確率密度関数 $f$ が次のように与えられているとする。 $$ y_{1} = u_{1} (x_{1} , \cdots , x_{n}) \\ \vdots \\ y_{n} = u_{n} (x_{1} , \cdots , x_{n}) $$ このような変換 $u_{1} , \cdots , u_{n}$ を考えよう。この変換は単射ではない可能性がある。したがって、$X$ のサポート $S_{X}$ は $k$ 個のパーティション $A_{1} , \cdots , A_{i} , \cdots , A_{k}$に分けられ、次のような逆変換 $w_{ji} \mid_{i=1,\cdots,k \\ j=1,\cdots,n}$ を考えることができる。 $$ x_{1} = w_{1i} ( y_{1} , \cdots , y_{n} ) \\ \vdots \\ x_{n} = w_{ni} ( y_{1} , \cdots , y_{n} ) $$ このような変換により $$ Y_{1} = u_{1} (X_{1} , \cdots, X_{n}) \\ \vdots \\ Y_{n} = u_{n} (X_{1} , \cdots, X_{n}) $$ 変換された多変量確率変数 $Y = ( Y_{1} , \cdots , Y_{n} )$ の結合確率密度関数 $g$ は次のようになる。 $$ g(y_{1},\cdots,y_{n}) = \sum_{i=1}^{k} f \left[ w_{1i}(y_{1},\cdots , y_{n}) , \cdots , w_{ni}(y_{1},\cdots , y_{n}) \right] \left| J_{i} \right| $$

$J_{i}$ は $i=1,\cdots , k$ 番目のヤコビアン $J_{i} := \begin{bmatrix} {{ \partial w_{1i} } \over { \partial y_{1} }} & \cdots & {{ \partial w_{1i} } \over { \partial y_{n} }} \\ \vdots & \ddots & \vdots \\ {{ \partial w_{ni} } \over { \partial y_{1} }} & \cdots & {{ \partial w_{ni} } \over { \partial y_{n} }} \end{bmatrix}$ である。
注意点として、離散確率変数に対してはヤコビアンを計算する必要はない。これは初歩的な誤りでありながらも、意外と多くの人が持っている誤解である。

例

確率変数の変換は、言葉だけが難しそうに見えるが、正直で複雑な計算が必要なものだ。変換が単射でない場合には、それぞれのケースでヤコビアンを計算しなければならないが、これがどれほど難しいかは問題によって異なる。この難しさを感じるために、次の例を考えてみよう。 $$ f(x_{1} , x_{2}) = \begin{cases} {{ 1 } \over { \pi }} &, 0 < x_{1}^{2} + x_{2}^{2} < 1 \\ 0 &, \text{otherwise} \end{cases} $$ このような確率密度関数を持つ確率変数は、円の内部の点を均一にサンプリングする。自然な変換は直交座標を極座標に変換することだろうが、理解を助けるために少し作為的な変換 $Y_{1} = X_{1}^{2} + X_{2}^{2}$、$Y_{2} = X_{1}^{2} / (X_{1}^{2} + X_{2}^{2})$ を考えてみよう。式には二乗が含まれているため、この変換は単射ではなく、次の四つのケースに分けて考える必要がある。 $$ x_{1} = \sqrt{y_{1} y_{2}} \land x_{2} = \sqrt{y_{1} (1 - y_{2}) } \\ x_{1} = \sqrt{y_{1} y_{2}} \land x_{2} = - \sqrt{y_{1} (1 - y_{2}) } \\ x_{1} = -\sqrt{y_{1} y_{2}} \land x_{2} = \sqrt{y_{1} (1 - y_{2}) } \\ x_{1} = - \sqrt{y_{1} y_{2}} \land x_{2} = - \sqrt{y_{1} (1 - y_{2}) } $$ これらの$i = 1, 2, 3, 4$ 番目のヤコビアンはそれぞれ次のように計算される。 $$ J_{1} = \begin{bmatrix} {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = - {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }} $$

$$ J_{2} = \begin{bmatrix} {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = - {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }} $$

$$ J_{3} = \begin{bmatrix} - {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ - {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }} $$

$$ J_{4} = \begin{bmatrix} - {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ - {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }} $$ したがって、$y_{1} , y_{2}$ で得られる新しい結合確率密度関数 $g$ は次のようになる。 $$ g(y_{1} , y_{2}) = \sum_{i=1}^{4} {{ 1 } \over { \pi }} \left| \pm {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }} \right| = {{ 1 } \over { \pi \sqrt{y_{2} (1 - y_{2})} }} $$

計算が吐き気を催すように見えるなら、それは正常だ。