확률 벡터
정의
다음을 만족하는 벡터 $\mathbf{p} = \begin{bmatrix}p_{1} & \cdots & p_{n} \end{bmatrix}^{\mathsf{T}}$을 확률 벡터probability/stochastic vector라 한다.
$$ 0 \le p_{i} \le 1 \quad (1 \le i \le n)\quad \text{and} \quad \sum_{i=1}^{n} p_{i} = 1 $$
설명
확률 벡터는 $n$개의 상태가 있을 때 각 상태에 대한 확률을 나타내는 벡터이다. 즉 개념적으로는 확률질량함수와 같다. 이산확률변수 $X$의 확률질량함수를 $p_{X}$라고 하면 확률 벡터는 다음과 같다.
$$ \mathbf{p} = \begin{bmatrix}p_{1} \\ \vdots \\ p_{n} \end{bmatrix} = \begin{bmatrix}p_{X}(1) \\ \vdots \\ p_{X}(n) \end{bmatrix} = \begin{bmatrix}p(1) \\ \vdots \\ p(n) \end{bmatrix} $$
$j$번째 상태가 $i$번째 상태로 바뀔 확률을 $q_{ij} = q(i | j)$라고 하면, 확률 벡터 $\mathbf{q}^{(j)} = \begin{bmatrix}q_{1j} & \cdots & q_{nj} \end{bmatrix}^{\mathsf{T}}$는 $j$번째 상태가 다른 상태로 바뀔 확률을 나타내는 벡터이다. 이 열벡터들의 행렬은 전이 행렬transition matrix이 된다.
$$ Q = \begin{bmatrix} \vert & \vert & & \vert \\ \mathbf{q}^{(1)} & \mathbf{q}^{(2)} & \cdots & \mathbf{q}^{(n)} \\ \vert & \vert & & \vert \end{bmatrix} = \begin{bmatrix} q_{11} & q_{12} & & q_{1n} \\ q_{21} & q_{22} & \cdots & q_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ q_{n1} & q_{n2} & \cdots & q_{nn} \end{bmatrix} $$
$\mathbf{p}$를 현재 상태에 대한 확률 벡터라 하면, $\mathbf{p}^{\prime} = Q \mathbf{p}$는 현재 상태에 대한 확률이 $\mathbf{p}$와 같이 주어졌을 때, 다음 상태에 대한 확률 벡터이다.
$$ \mathbf{p}^{\prime} = Q \mathbf{p} = \begin{bmatrix} \sum\limits_{j} q_{ij} p_{j} \\ \sum\limits_{j} q_{2j} p_{j} \\ \vdots \\[1em] \sum\limits_{j} q_{nj} p_{j} \end{bmatrix} = \begin{bmatrix} \sum\limits_{j} q(1 | j) p(j) \\ \sum\limits_{j} q(2 | j) p(j) \\ \vdots \\[1em] \sum\limits_{j} q(n | j) p(j) \end{bmatrix} = \begin{bmatrix}p^{\prime}(1) \\[1em] p^{\prime}(2) \\[1em] \vdots \\[1em] p^{\prime}(n) \end{bmatrix} $$
표기법
현재 상태에 관한 확률 행벡터를 $\pi$, 전이 행렬을 $P = \begin{bmatrix} - \mathbf{p}^{(1)} - \\ \vdots \\ - \mathbf{p}^{(n)} - \end{bmatrix}$라고 두고 다음과 같은 표기법이 주로 쓰인다.
$$ \pi P = \pi^{\prime} $$
이 경우에는 $P_{ij} = P(j | i)$가 되어 $i$행 $j$열 성분은 $i$번째 상태에서 $j$번째 상태로 바뀔 확률이 된다. 왜 행벡터 위주의 표기법을 쓰는지는 잘 모르겠다. 전이 행렬의 표기로는 transition의 t를 따와서 $T$도 쓰이는 편이다.