数理統計学における分布収束
定義 1
確率変数 $X$ と確率変数のシーケンス $\left\{ X_{n} \right\}$ が次を満たす場合、$n \to \infty$ の時、$X_{n}$ へ分布収束convergence in distributionすると言い、$X_{n} \overset{D}{\to} X$ と表示される。 $$ \lim_{n \to \infty} F_{X_{n}} (x) = F_{X} (x) \qquad, \forall x \in C_{F_{X}} $$
- $F_{X}$ は確率変数$X$の累積分布関数である。
- $C_{F_{X}}$ は関数$F_{X}$が連続である点の集合を示している。
説明
分布収束は、分布のセンスで収束を定義した概念であり、確率収束と同様である。それぞれの$x \in C_{F_{X}}$に対する収束は、実際には解析学で言う関数の点収束と似ており、この類似点は、確率収束するならば分布収束するという事実にもつながる。
注意すべきは、分布収束と言っても、$X_{n} \overset{D}{\to} X$ で正確に表されるように、「分布収束」もまた「確率変数の収束」について議論したいということだ。分布関数が連続部分で点収束するということは、正確には確率変数が収束するわけではなく、それが持つ性質の一つである分布が収束するということである。当然ながら、これは確率変数自体の収束よりもはるかにゆるい前提となる。分布の観点から違いがないとしても、確率変数が本質的に収束するわけではない。
実際には、$X_{n} \overset{D}{\to} X$ としても $Y_{n} \overset{D}{\to} Y$ と $X_{n} + Y_{n}$ が$X + Y$ に分布収束することが保証されるわけではない。確率収束とは異なり、分布収束は累積分布関数の点収束という軽い条件だけで充分であり、そのためにこれら常識的な性質すら持たない。
理論
$X_{n} \overset{D}{\to} X$ とする。
- [1] 連続写像の定理:連続関数$g$について $$ g\left( X_{n} \right) \overset{D}{\to} g (X) $$
- $$ X_{n} \overset{P}{\to} X \implies X_{n} \overset{D}{\to} X $$
- [4] スルツキーの定理2: 定数$a,b$と確率変数$A_{n}, B_{n} ,X_{n} , X$に対して$a_{n} \overset{P}{\to} a $、$ B_{n} \overset{P}{\to} b $、$ X_{n} \overset{D}{\to} X $であれば $$ A_{n} + B_{n} X_{n} \overset{D}{\to} a + b X $$
極限分布
一方、$X_{n} \overset{D}{\to} X$ であれば、$X$ の分布を$\left\{ X_{n} \right\}$の漸近asyptoticまたは極限limiting分布とも言う。便宜上、$X$の分布をそのまま使うこともあるが、例えば$X \sim N(0,1)$ であれば次のように表される3。 $$ X_{n} \overset{D}{\to} N(0,1) $$
例
[a] 二項分布の極限分布としてのポアソン分布の導出: $X_{n} \sim B(n,p)$とする。
$\mu \approx np$であれば $$ X_{n} \overset{D}{\to} \text{Poi} (\mu) $$ [b] 二項分布の極限分布としての標準正規分布の導出: $X_i \sim B(1,p)$であり、$Y_n = X_1 + X_2 + \cdots + X_n$であれば、$Y_n \sim B(n,p)$である $$ { { Y_n - np } \over {\sqrt{ np(1-p) } } }\overset{D}{\to} N(0,1) $$ [c] ポアソン分布の極限分布としての標準正規分布の導出: $X_{n} \sim \text{Poi} \left( n \right)$であり、$\displaystyle Y_{n} := {{ X_{n} - n } \over { \sqrt{n} }}$であれば $$ Y_{n} \overset{D}{\to} N(0,1) $$ [d] スチューデントのt分布の極限分布としての標準正規分布の導出: $T_n \sim t(n)$であれば $$ T_n \ \overset{D}{\to} N(0,1) $$
極限分布が必要な理由
これらの漸近分布から、分布収束が確率変数自体の収束と呼ぶには不十分であることがわかる。例えば、十分に大きな分布$n$が与えられ、正規分布に近似することができたとしても、その確率変数自体の本質が正規分布を模倣することはできない。$n$がどれだけ大きくても、二項分布は二項分布であり、正規分布は正規分布である。しかし、分布が似ているため、一見して区別がつかないだけである。
それでも分布収束を考える理由は、その区別がつかない程度で十分であり、条件でこれ以上妥協する余地がない場合があるからである。前述のように、どれだけ変わっても離散確率分布は連続確率分布になることはない。しかし、弱収束の概念を導入してすぐに離散確率分布を連続確率分布のように使えるならば、考慮しない理由はない。
証明
[1][4]
■
[2](../175)
■
[3](../176)
■
[a]
■
[b]
■
[c]
■
[d]
■