조건부 엔트로피
📂확률론조건부 엔트로피
정의
확률변수 X1,⋯,Xn 의 결합확률질량함수 p 혹은 결합확률밀도함수 f 가 주어져 있다고 하자. H(X1,⋯,Xn∣Xk) 을 Xk 가 주어져 있을 때 X1,⋯,Xn 의 조건부 엔트로피conditional Entropy라 한다.
이산
H(X1,⋯,Xn∣Xk):=−x1∑⋯xn∑p(x1,⋯,xn)log2p(xk)p(x1,⋯,xn)
연속
H(X1,⋯,Xn∣Xk):=−∫R⋯∫Rf(x1,⋯,xn)log2f(xk)f(x1,⋯,xn)dx1⋯dxn
- 표현이 너무 지저분해서 정확히 쓰지는 않았지만 X1⋯Xn 사이에는 Xk 가 없다. 하지만 x1,⋯,xn 사이에는 xk 가 있다.
정리
- [1] 두 확률변수 X,Y 에 대해 다음이 성립한다.
H(X,Y)=H(X)+H(Y∣X)
특히 X 와 Y 가 독립이면
H(X∣Y)=H(X)H(Y∣X)=H(Y)
- [2] Chain Rule:
H(X1,⋯,Xn)==H(X1)+H(Xk∣X1,⋯,Xk−1)H(X1)+H(X2∣X1)+H(X3∣X1,X2)+⋯+H(Xn)+H(Xk∣X1,⋯,Xn−1)
설명
말 그대로 조인트 엔트로피에서 추가적인 조건이 주어졌을 때의 엔트로피다. 수식을 직관적으로 이해해보자면
H(Y∣X)=H(X,Y)−H(X)
는 원래 H(X,Y) 만큼의 무질서도에서 X 의 정보가 제공되어 H(X) 만큼의 불확실성이 해소된 것으로 볼 수 있다. 체인 룰chain rule은 그의 일반화다.