확률 벡터
📂수리통계학확률 벡터
정의
다음을 만족하는 벡터 p=[p1⋯pn]T을 확률 벡터probability/stochastic vector라 한다.
0≤pi≤1(1≤i≤n)andi=1∑npi=1
설명
확률 벡터는 n개의 상태가 있을 때 각 상태에 대한 확률을 나타내는 벡터이다. 즉 개념적으로는 확률질량함수와 같다. 이산확률변수 X의 확률질량함수를 pX라고 하면 확률 벡터는 다음과 같다.
p=p1⋮pn=pX(1)⋮pX(n)=p(1)⋮p(n)
j번째 상태가 i번째 상태로 바뀔 확률을 qij=q(i∣j)라고 하면, 확률 벡터 q(j)=[q1j⋯qnj]T는 j번째 상태가 다른 상태로 바뀔 확률을 나타내는 벡터이다. 이 열벡터들의 행렬은 전이 행렬transition matrix이 된다.
Q=∣q(1)∣∣q(2)∣⋯∣q(n)∣=q11q21⋮qn1q12q22⋮qn2⋯⋱⋯q1nq2n⋮qnn
p를 현재 상태에 대한 확률 벡터라 하면, p′=Qp는 현재 상태에 대한 확률이 p와 같이 주어졌을 때, 다음 상태에 대한 확률 벡터이다.
p′=Qp=j∑qijpjj∑q2jpj⋮j∑qnjpj=j∑q(1∣j)p(j)j∑q(2∣j)p(j)⋮j∑q(n∣j)p(j)=p′(1)p′(2)⋮p′(n)
표기법
현재 상태에 관한 확률 행벡터를 π, 전이 행렬을 P=−p(1)−⋮−p(n)−라고 두고 다음과 같은 표기법이 주로 쓰인다.
πP=π′
이 경우에는 Pij=P(j∣i)가 되어 i행 j열 성분은 i번째 상태에서 j번째 상태로 바뀔 확률이 된다. 왜 행벡터 위주의 표기법을 쓰는지는 잘 모르겠다. 전이 행렬의 표기로는 transition의 t를 따와서 T도 쓰이는 편이다.