logo

数理統計学における多変量確率分布 📂数理統計学

数理統計学における多変量確率分布

定義 1

  1. 標本空間 Ω\Omegaで定義されたnn個の確率変数 XiX_{i}に対しX=(X1,,Xn)X = (X_{1} , \cdots , X_{n})nn次元ランダムベクトルrandom Vectorという。XXの値域X(Ω)X(\Omega)空間とも呼ぶ。
  2. 次のを満たす関数FX:Rn[0,1]F_{X} : \mathbb{R}^{n} \to [0,1]XXジョイントjoint累積分布関数という。 FX(x1,,xn):=P[X1x1,,Xnxn] F_{X}\left( x_{1}, \cdots , x_{n} \right) := P \left[ X_{1} \le x_{1} , \cdots , X_{n} \le x_{n} \right]
  3. あるh1,,hn>0h_{1} , \cdots , h_{n} >0に対し、次のを満たす関数MXM_{X}が存在するなら、XX積率生成関数という。 MX(t1,,tn):=E[ek=1ntkXk]=E[k=1netkXk]t1<h1,,tn<hn M_{X} (t_{1}, \cdots , t_{n}) := E \left[ e^{\sum_{k=1}^{n} t_{k} X_{k} } \right] = E \left[ \prod_{k=1}^{n} e^{t_{k} X_{k}} \right] \\ |t_{1}| < h_{1} , \cdots , |t_{n} | < h_{n}

離散

  • D1: XXの空間が可算集合なら、XX離散ランダムベクトルという。
  • D2: 次を満たすpX:Rn[0,1]p_{X} : \mathbb{R}^{n} \to [0,1]を離散ランダムベクトルXXジョイント確率質量関数という。 pX(x1,,xn):=P[X1=x1,,Xn=xn] p_{X} (x_{1} , \cdots , x_{n}) := P \left[ X_{1} = x_{1} , \cdots , X_{n} = x_{n} \right]
  • D3: 1kn1 \le k \le nに対し、次のようなPXk(xk)P_{X_{k}} (x_{k})マージナル確率質量関数という。 PXk(xk):=x1xk1xk+1xnpX(x1,,xn) P_{X_{k}} (x_{k}) := \sum_{x_{1}} \cdots \sum_{x_{k-1}}\sum_{x_{k+1}} \cdots \sum_{x_{n}} p_{X} (x_{1} , \cdots , x_{n})
  • D4: SX:={xRn:pX(x)>0}S_{X}:= \left\{ \mathbf{x} \in \mathbb{R}^{n} : p_{X}(\mathbf{x}) > 0 \right\}XXサポートという。

連続

  • C1: 確率変数XXの累積分布関数FX=FX1,,XnF_{X} = F_{X_{1} , \cdots , X_{n}}が全てのxRn\mathbf{x} \in \mathbb{R}^{n}連続なら、XX連続ランダムベクトルという。
  • C2: 次を満たすfX:Rn[0,)f_{X} : \mathbb{R}^{n} \to [0,\infty)を、連続ランダムベクトルXXジョイント確率密度関数という。 FX(x1,,xn)=x1xnfx(t1,,tn)dt1dtn F_{X} (x_{1}, \cdots, x_{n}) = \int_{-\infty}^{x_{1}} \cdots \int_{-\infty}^{x_{n}} f_{\mathbf{x}} (t_{1} , \cdots , t_{n}) dt_{1} \cdots d t_{n}
  • C3: 1kn1 \le k \le nに対し、次のようなfXk(tk)f_{X_{k}} (t_{k})マージナル確率密度関数という。 fXk(tk):=x1xk1xk+1xnfX(t1,,tn)dt1dk1dk+1dn f_{X_{k}}(t_{k}) := \int_{\infty}^{x_{1}} \cdots \int_{\infty}^{x_{k-1}} \int_{\infty}^{x_{k+1}} \cdots \int_{\infty}^{x_{n}} f_{X}(t_{1} , \cdots , t_{n}) dt_{1} \cdots d_{k-1} d_{k+1} \cdots d_{n}
  • C4: SX:={tRn:fX(t)>0}S_{X} := \left\{ \mathbf{t} \in \mathbb{R}^{n} : f_{X} ( \mathbf{t} ) > 0 \right\}XXサポートという。

  • 元々ランダムベクトルrandom Vectorは、確率ベクトルと訳されるが、高校卒業以上でStochasticやProbabilisticなどと混同されることを避けるため、原語をそのまま使う。
  • 元々ジョイント累積分布関数joint Cumulative Distribution functionは、結合確率分布と訳されるが、独立や依存に対する誤解を招く可能性があるため、原語をそのまま使う。
  • 元々マージナル分布marginal distributionは、周辺分布と訳されるが、経済学の限界marginalのようにその意味が伝わりにくいと思われるため、原語をそのまま使う。

説明

多変量確率分布は、一変量確率分布を多次元に一般化したものであり、変数が複数ある点で根本的に大きな違いがあるが、少なくとも学部レベルの数理統計学では、微積分学的なスキルでも十分に異なることができる。どのように異なるか見てみよう:

  • 1: 混同してはいけないのは、ランダムベクトルX:ΩnRnX : \Omega^{n} \to \mathbb{R}^{n}も依然として関数であることだ。そのため、その値域を考えることができ、これにより多変量に関しても離散型と連続型に分類する。
  • C2: 連続のジョイント密度関数は、一般的に確率が00ARnA \subset \mathbb{R}^{n}を除き、微積分学の基本定理に従って次のを満たすように定義される。 nx1xnFX(x)=f(x) {{ \partial^{n} } \over { \partial x_{1} \cdots \partial x_{n} }} F_{X} (\mathbf{x}) = f(\mathbf{x})
  • D3, C3: 式は複雑だが、簡単に言えば、ジョイント確率分布を純粋に確率変数XkX_{k}に関する分布に変えたものだ。経済学でマージナルという言葉が微分の概念と通じるのと反対に、数理統計学では関心のない変数を一掃するために積分や合計をすることだ。

  1. Hogg et al. (2013). Introduction to Mathematical Statistics(7th Edition): p75~84. ↩︎