数理統計学における多変量確率分布
📂数理統計学数理統計学における多変量確率分布
定義
- 標本空間 Ωで定義されたn個の確率変数 Xiに対しX=(X1,⋯,Xn)をn次元ランダムベクトルrandom Vectorという。Xの値域X(Ω)を空間とも呼ぶ。
- 次のを満たす関数FX:Rn→[0,1]をXのジョイントjoint累積分布関数という。
FX(x1,⋯,xn):=P[X1≤x1,⋯,Xn≤xn]
- あるh1,⋯,hn>0に対し、次のを満たす関数MXが存在するなら、Xの積率生成関数という。
MX(t1,⋯,tn):=E[e∑k=1ntkXk]=E[k=1∏netkXk]∣t1∣<h1,⋯,∣tn∣<hn
離散
- D1: Xの空間が可算集合なら、Xは離散ランダムベクトルという。
- D2: 次を満たすpX:Rn→[0,1]を離散ランダムベクトルXのジョイント確率質量関数という。
pX(x1,⋯,xn):=P[X1=x1,⋯,Xn=xn]
- D3: 1≤k≤nに対し、次のようなPXk(xk)をマージナル確率質量関数という。
PXk(xk):=x1∑⋯xk−1∑xk+1∑⋯xn∑pX(x1,⋯,xn)
- D4: SX:={x∈Rn:pX(x)>0}をXのサポートという。
連続
- C1: 確率変数Xの累積分布関数FX=FX1,⋯,Xnが全てのx∈Rnで連続なら、Xは連続ランダムベクトルという。
- C2: 次を満たすfX:Rn→[0,∞)を、連続ランダムベクトルXのジョイント確率密度関数という。
FX(x1,⋯,xn)=∫−∞x1⋯∫−∞xnfx(t1,⋯,tn)dt1⋯dtn
- C3: 1≤k≤nに対し、次のようなfXk(tk)をマージナル確率密度関数という。
fXk(tk):=∫∞x1⋯∫∞xk−1∫∞xk+1⋯∫∞xnfX(t1,⋯,tn)dt1⋯dk−1dk+1⋯dn
- C4: SX:={t∈Rn:fX(t)>0}をXのサポートという。
- 元々ランダムベクトルrandom Vectorは、確率ベクトルと訳されるが、高校卒業以上でStochasticやProbabilisticなどと混同されることを避けるため、原語をそのまま使う。
- 元々ジョイント累積分布関数joint Cumulative Distribution functionは、結合確率分布と訳されるが、独立や依存に対する誤解を招く可能性があるため、原語をそのまま使う。
- 元々マージナル分布marginal distributionは、周辺分布と訳されるが、経済学の限界marginalのようにその意味が伝わりにくいと思われるため、原語をそのまま使う。
説明
多変量確率分布は、一変量確率分布を多次元に一般化したものであり、変数が複数ある点で根本的に大きな違いがあるが、少なくとも学部レベルの数理統計学では、微積分学的なスキルでも十分に異なることができる。どのように異なるか見てみよう:
- 1: 混同してはいけないのは、ランダムベクトルX:Ωn→Rnも依然として関数であることだ。そのため、その値域を考えることができ、これにより多変量に関しても離散型と連続型に分類する。
- C2: 連続のジョイント密度関数は、一般的に確率が0のA⊂Rnを除き、微積分学の基本定理に従って次のを満たすように定義される。
∂x1⋯∂xn∂nFX(x)=f(x)
- D3, C3: 式は複雑だが、簡単に言えば、ジョイント確率分布を純粋に確率変数Xkに関する分布に変えたものだ。経済学でマージナルという言葉が微分の概念と通じるのと反対に、数理統計学では関心のない変数を一掃するために積分や合計をすることだ。