logo

多変量確率変数の変換 📂数理統計学

多変量確率変数の変換

公式

多変量確率変数 X=(X1,,Xn)X = ( X_{1} , \cdots , X_{n} ) の結合確率密度関数 ff が次のように与えられているとする。 y1=u1(x1,,xn)yn=un(x1,,xn) y_{1} = u_{1} (x_{1} , \cdots , x_{n}) \\ \vdots \\ y_{n} = u_{n} (x_{1} , \cdots , x_{n}) このような変換 u1,,unu_{1} , \cdots , u_{n} を考えよう。この変換は単射ではない可能性がある。したがって、XX のサポート SXS_{X}kk 個のパーティション A1,,Ai,,AkA_{1} , \cdots , A_{i} , \cdots , A_{k}に分けられ、次のような逆変換 wjii=1,,kj=1,,nw_{ji} \mid_{i=1,\cdots,k \\ j=1,\cdots,n} を考えることができる。 x1=w1i(y1,,yn)xn=wni(y1,,yn) x_{1} = w_{1i} ( y_{1} , \cdots , y_{n} ) \\ \vdots \\ x_{n} = w_{ni} ( y_{1} , \cdots , y_{n} ) このような変換により Y1=u1(X1,,Xn)Yn=un(X1,,Xn) Y_{1} = u_{1} (X_{1} , \cdots, X_{n}) \\ \vdots \\ Y_{n} = u_{n} (X_{1} , \cdots, X_{n}) 変換された多変量確率変数 Y=(Y1,,Yn)Y = ( Y_{1} , \cdots , Y_{n} ) の結合確率密度関数 gg は次のようになる。 g(y1,,yn)=i=1kf[w1i(y1,,yn),,wni(y1,,yn)]Ji g(y_{1},\cdots,y_{n}) = \sum_{i=1}^{k} f \left[ w_{1i}(y_{1},\cdots , y_{n}) , \cdots , w_{ni}(y_{1},\cdots , y_{n}) \right] \left| J_{i} \right|


  • JiJ_{i}i=1,,ki=1,\cdots , k 番目のヤコビアン Ji:=[w1iy1w1iynwniy1wniyn]J_{i} := \begin{bmatrix} {{ \partial w_{1i} } \over { \partial y_{1} }} & \cdots & {{ \partial w_{1i} } \over { \partial y_{n} }} \\ \vdots & \ddots & \vdots \\ {{ \partial w_{ni} } \over { \partial y_{1} }} & \cdots & {{ \partial w_{ni} } \over { \partial y_{n} }} \end{bmatrix} である。
  • 注意点として、離散確率変数に対してはヤコビアンを計算する必要はない。これは初歩的な誤りでありながらも、意外と多くの人が持っている誤解である。

確率変数の変換は、言葉だけが難しそうに見えるが、正直で複雑な計算が必要なものだ。変換が単射でない場合には、それぞれのケースでヤコビアンを計算しなければならないが、これがどれほど難しいかは問題によって異なる。この難しさを感じるために、次の例を考えてみよう。 f(x1,x2)={1π,0<x12+x22<10,otherwise f(x_{1} , x_{2}) = \begin{cases} {{ 1 } \over { \pi }} &, 0 < x_{1}^{2} + x_{2}^{2} < 1 \\ 0 &, \text{otherwise} \end{cases} このような確率密度関数を持つ確率変数は、円の内部の点を均一にサンプリングする。自然な変換は直交座標を極座標に変換することだろうが、理解を助けるために少し作為的な変換 Y1=X12+X22Y_{1} = X_{1}^{2} + X_{2}^{2}Y2=X12/(X12+X22)Y_{2} = X_{1}^{2} / (X_{1}^{2} + X_{2}^{2}) を考えてみよう。式には二乗が含まれているため、この変換は単射ではなく、次の四つのケースに分けて考える必要がある。 x1=y1y2x2=y1(1y2)x1=y1y2x2=y1(1y2)x1=y1y2x2=y1(1y2)x1=y1y2x2=y1(1y2) x_{1} = \sqrt{y_{1} y_{2}} \land x_{2} = \sqrt{y_{1} (1 - y_{2}) } \\ x_{1} = \sqrt{y_{1} y_{2}} \land x_{2} = - \sqrt{y_{1} (1 - y_{2}) } \\ x_{1} = -\sqrt{y_{1} y_{2}} \land x_{2} = \sqrt{y_{1} (1 - y_{2}) } \\ x_{1} = - \sqrt{y_{1} y_{2}} \land x_{2} = - \sqrt{y_{1} (1 - y_{2}) } これらのi=1,2,3,4i = 1, 2, 3, 4 番目のヤコビアンはそれぞれ次のように計算される。 J1=[12y2y112y1y2121y2y112y11y2]=14y2(1y2) J_{1} = \begin{bmatrix} {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = - {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }}

J2=[12y2y112y1y2121y2y112y11y2]=14y2(1y2) J_{2} = \begin{bmatrix} {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = - {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }}

J3=[12y2y112y1y2121y2y112y11y2]=14y2(1y2) J_{3} = \begin{bmatrix} - {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ - {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }}

J4=[12y2y112y1y2121y2y112y11y2]=14y2(1y2) J_{4} = \begin{bmatrix} - {{ 1 } \over { 2 }} \sqrt{{ y_{2} } \over { y_{1} }} & - {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { y_{2} }} \\ - {{ 1 } \over { 2 }} \sqrt{{ 1 - y_{2} } \over { y_{1} }} & {{ 1 } \over { 2 }} \sqrt{{ y_{1} } \over { 1 - y_{2} }} \end{bmatrix} = {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }} したがって、y1,y2y_{1} , y_{2} で得られる新しい結合確率密度関数 gg は次のようになる。 g(y1,y2)=i=141π±14y2(1y2)=1πy2(1y2) g(y_{1} , y_{2}) = \sum_{i=1}^{4} {{ 1 } \over { \pi }} \left| \pm {{ 1 } \over { 4 \sqrt{y_{2} (1 - y_{2})} }} \right| = {{ 1 } \over { \pi \sqrt{y_{2} (1 - y_{2})} }}

計算が吐き気を催すように見えるなら、それは正常だ。