다항실험과 분할표
정의 1
다항실험
다음의 특성을 가지면서 세가지 이상 가능한 결과 혹은 범주를 갖는 실험을 다항 실험multinomial experiment이라 한다.
- $n$ 번의 동일한 시행으로 구성된다.
- 각 시행의 결과는 $k>2$가지의 가능한 결과 혹은 범주 중 하나다.
- 각 시행은 독립이다.
- 여러 개의 결과들의 확률은 매 시행마다 일정하다.
분할표
하나의 원소에 대해 두 가지 이상의 변수에 대한 정보가 있다고 할 때, 이를 요약하는 표를 분할표contingency table라 한다.
X | Y | |
---|---|---|
Aaa | 0000 | 0000 |
Bbb | 0000 | 0000 |
Ccc | 0000 | 0000 |
설명
다항실험이란 다름 아닌 다항분포를 가정할 수 있을 때의 데이터를 얻는 실험이다.
다항 분포: $n \in \mathbb{N}$ 과 범주 $k \in \mathbb{N}$ 개만큼의 확률변수로 이루어진 랜덤벡터를 $\left( X_{1} , \cdots , X_{k} \right)$ 와 같이 나타내자. $$ \sum_{i=1}^{k} X_{i} = n \qquad \& \qquad \sum_{i=1}^{k} p_{i} = 1 $$ 를 만족시키는 $\mathbf{p} = \left( p_{1} , \cdots , p_{k} \right) \in [0,1]^{k}$ 에 대해 다음과 같은 확률 질량 함수를 가지는 다변량확률분포 $M_{k} \left( n, \mathbf{p} \right)$ 를 다항 분포multinomial distribution라 한다. $$ p \left( x_{1} , \cdots , x_{k} \right) = {{ n! } \over { x_{1} ! \cdots x_{k}! }} p_{1}^{x_{1}} \cdots p_{k}^{x_{k}} \qquad , x_{1} , \cdots , x_{k} \in \mathbb{N}_{0} $$
경북대학교 통계학과. (2008). 엑셀을 이용한 통계학: p266, 270. ↩︎