logo

확률 벡터 📂수리통계학

확률 벡터

정의

다음을 만족하는 벡터 p=[p1pn]T\mathbf{p} = \begin{bmatrix}p_{1} & \cdots & p_{n} \end{bmatrix}^{\mathsf{T}}확률 벡터probability/stochastic vector라 한다.

0pi1(1in)andi=1npi=1 0 \le p_{i} \le 1 \quad (1 \le i \le n)\quad \text{and} \quad \sum_{i=1}^{n} p_{i} = 1

설명

확률 벡터는 nn개의 상태가 있을 때 각 상태에 대한 확률을 나타내는 벡터이다. 즉 개념적으로는 확률질량함수와 같다. 이산확률변수 XX의 확률질량함수를 pXp_{X}라고 하면 확률 벡터는 다음과 같다.

p=[p1pn]=[pX(1)pX(n)]=[p(1)p(n)] \mathbf{p} = \begin{bmatrix}p_{1} \\ \vdots \\ p_{n} \end{bmatrix} = \begin{bmatrix}p_{X}(1) \\ \vdots \\ p_{X}(n) \end{bmatrix} = \begin{bmatrix}p(1) \\ \vdots \\ p(n) \end{bmatrix}

jj번째 상태가 ii번째 상태로 바뀔 확률을 qij=q(ij)q_{ij} = q(i | j)라고 하면, 확률 벡터 q(j)=[q1jqnj]T\mathbf{q}^{(j)} = \begin{bmatrix}q_{1j} & \cdots & q_{nj} \end{bmatrix}^{\mathsf{T}}jj번째 상태가 다른 상태로 바뀔 확률을 나타내는 벡터이다. 이 열벡터들의 행렬은 전이 행렬transition matrix이 된다.

Q=[q(1)q(2)q(n)]=[q11q12q1nq21q22q2nqn1qn2qnn] Q = \begin{bmatrix} \vert & \vert & & \vert \\ \mathbf{q}^{(1)} & \mathbf{q}^{(2)} & \cdots & \mathbf{q}^{(n)} \\ \vert & \vert & & \vert \end{bmatrix} = \begin{bmatrix} q_{11} & q_{12} & & q_{1n} \\ q_{21} & q_{22} & \cdots & q_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ q_{n1} & q_{n2} & \cdots & q_{nn} \end{bmatrix}

p\mathbf{p}를 현재 상태에 대한 확률 벡터라 하면, p=Qp\mathbf{p}^{\prime} = Q \mathbf{p}는 현재 상태에 대한 확률이 p\mathbf{p}와 같이 주어졌을 때, 다음 상태에 대한 확률 벡터이다.

p=Qp=[jqijpjjq2jpjjqnjpj]=[jq(1j)p(j)jq(2j)p(j)jq(nj)p(j)]=[p(1)p(2)p(n)] \mathbf{p}^{\prime} = Q \mathbf{p} = \begin{bmatrix} \sum\limits_{j} q_{ij} p_{j} \\ \sum\limits_{j} q_{2j} p_{j} \\ \vdots \\[1em] \sum\limits_{j} q_{nj} p_{j} \end{bmatrix} = \begin{bmatrix} \sum\limits_{j} q(1 | j) p(j) \\ \sum\limits_{j} q(2 | j) p(j) \\ \vdots \\[1em] \sum\limits_{j} q(n | j) p(j) \end{bmatrix} = \begin{bmatrix}p^{\prime}(1) \\[1em] p^{\prime}(2) \\[1em] \vdots \\[1em] p^{\prime}(n) \end{bmatrix}

표기법

현재 상태에 관한 확률 행벡터π\pi, 전이 행렬을 P=[p(1)p(n)]P = \begin{bmatrix} - \mathbf{p}^{(1)} - \\ \vdots \\ - \mathbf{p}^{(n)} - \end{bmatrix}라고 두고 다음과 같은 표기법이 주로 쓰인다.

πP=π \pi P = \pi^{\prime}

이 경우에는 Pij=P(ji)P_{ij} = P(j | i)가 되어 iijj열 성분은 ii번째 상태에서 jj번째 상태로 바뀔 확률이 된다. 왜 행벡터 위주의 표기법을 쓰는지는 잘 모르겠다. 전이 행렬의 표기로는 transition의 t를 따와서 TT도 쓰이는 편이다.