logo

깁스 부등식 📂확률론

깁스 부등식

개요

깁스 부등식gibbs Inequality샤넌 엔트로피크로스 엔트로피 사이의 관계를 말해주며, 쿨백-라이블러 발산의 하한을 보장해주는 부등식이다.

정리

H(P)H(P,Q) H(P) \le H(P,Q)

증명 1

이산형에 대한 경우만 증명하고, 모든 kk 에 대해 pk>0p_{k} > 0 이라 가정한다.

곡선 y=lnxy = \ln xx=1x=1 에서의 접선의 방정식은 y=x1y = x - 1 이다. 로그함수는 위로 볼록한 함수이므로 오직 한 점 (1,0)R(1,0) \in \mathbb{R} 에서만 접하므로, x>0x > 0 에서 lnxx1\ln x \le x - 1 임을 알 수 있다. 로그의 밑변환 공식에 따라 다음 수식 두번째 줄의 등호가, lnxx1\ln x \le x - 1 에 의해 세번째 줄의 등호가 성립한다. k=1npklog2pk+k=1npklog2qk=k=1npklog2qkpk=1ln2k=1npklnqkpk1ln2k=1npk(qkpk1)=1ln2(k=1nqkk=1npk)=11=0 \begin{align*} -\sum_{k=1}^{n} p_{k} \log_{2} p_{k} + \sum_{k=1}^{n} p_{k} \log_{2} q_{k} =& \sum_{k=1}^{n} p_{k} \log_{2} {{ q_{k} } \over { p_{k} }} \\ =& {{ 1 } \over { \ln 2 }} \sum_{k=1}^{n} p_{k} \ln {{ q_{k} } \over { p_{k} }} \\ \le & {{ 1 } \over { \ln 2 }} \sum_{k=1}^{n} p_{k} \left( {{ q_{k} } \over { p_{k} }} - 1 \right) \\ =& {{ 1 } \over { \ln 2 }} \left( \sum_{k=1}^{n} q_{k} - \sum_{k=1}^{n} p_{k} \right) \\ =& 1 - 1 \\ =& 0 \end{align*} H(P,Q)=k=1npklog2qkH(P,Q) = \sum_{k=1}^{n} p_{k} \log_{2} q_{k} 를 우변으로 넘기면 H(P)=k=1npklog2pkk=1npklog2qk=H(P,Q) H(P) = \sum_{k=1}^{n} p_{k} \log_{2} p_{k} \le \sum_{k=1}^{n} p_{k} \log_{2} q_{k} = H(P,Q)


  1. 강정흥. (2020). 확률정보론: p110. ↩︎