logo

정규분포의 엔트로피 📂확률분포론

정규분포의 엔트로피

정리

정규분포 N(μ,σ2)N(\mu, \sigma^{2})엔트로피는 (자연로그를 택했을 때) 다음과 같다.

H=12ln(2πeσ2)=ln2πeσ2 H = \dfrac{1}{2} \ln (2\pi e \sigma^{2}) = \ln \sqrt{2\pi e \sigma^{2}}

다변량 정규분포 Np(μ,Σ)N_{p}(\boldsymbol{\mu}, \Sigma)의 엔트로피는 다음과 같다.

H=12ln[(2πe)pΣ]=12ln(det(2πeΣ)) H = \dfrac{1}{2}\ln \left[ (2 \pi e)^{p} \left| \Sigma \right| \right] = \dfrac{1}{2}\ln (\det (2\pi e \Sigma))

Σ\left| \Sigma \right|공분산행렬행렬식이다.

설명

평균 μ\mu는 엔트로피에 영향을 미치지 않는다. 자연로그를 택했을 때 표준정규분포 N(0,1)N(0,1)의 엔트로피는 대략 H=ln2πe1.4189385332046727H = \ln \sqrt{2\pi e } \approx 1.4189385332046727이다. 밑이 22인 로그를 택해도 공식의 꼴은 그대로이며 그 값은,

H=log22πe2.047095585180641 H = \log_{2} \sqrt{2\pi e } \approx 2.047095585180641

증명

일변량 정규분포

이를 보일 때 p(x)=12πσ2exp((xμ)22σ2)p(x) = \dfrac{1}{\sqrt{2\pi\sigma^{2}}}\exp\left( - \dfrac{(x-\mu)^{2}}{2\sigma^{2}} \right)의 적분이 11이라는 것을 이용한다.

H=p(x)lnp(x)dx=p(x)ln[12πσ2exp((xμ)22σ2)]dx=p(x)ln12πσ2dxp(x)lnexp((xμ)22σ2)dx=ln12πσ2+p(x)(xμ)22σ2dx=ln2πσ2+12σ2p(x)(xμ)2dx=ln2πσ2+12σ2E[(Xμ)2]=ln2πσ2+12σ2σ2=ln2πσ2+12=ln2πσ2+lne=ln2πeσ2 \begin{align*} H &= - \int_{-\infty}^{\infty} p(x) \ln p(x) dx \\ &= - \int_{-\infty}^{\infty} p(x) \ln \left[ \dfrac{1}{\sqrt{2\pi\sigma^{2}}}\exp\left( - \dfrac{(x-\mu)^{2}}{2\sigma^{2}} \right) \right] dx \\ &= - \int_{-\infty}^{\infty} p(x) \ln \dfrac{1}{\sqrt{2\pi\sigma^{2}}} dx - \int_{-\infty}^{\infty} p(x) \ln \exp\left( - \dfrac{(x-\mu)^{2}}{2\sigma^{2}} \right) dx \\ &= -\ln \dfrac{1}{\sqrt{2\pi\sigma^{2}}} + \int_{-\infty}^{\infty} p(x) \dfrac{(x-\mu)^{2}}{2\sigma^{2}} dx \\ &= \ln \sqrt{2\pi\sigma^{2}} + \dfrac{1}{2\sigma^{2}}\int_{-\infty}^{\infty} p(x) (x-\mu)^{2} dx \\ &= \ln \sqrt{2\pi\sigma^{2}} + \dfrac{1}{2\sigma^{2}} E[(X-\mu)^{2}] \\ &= \ln \sqrt{2\pi\sigma^{2}} + \dfrac{1}{2\sigma^{2}}\sigma^{2} \\ &= \ln \sqrt{2\pi\sigma^{2}} + \dfrac{1}{2} \\ &= \ln \sqrt{2\pi\sigma^{2}} + \ln \sqrt{e} \\ &= \ln \sqrt{2\pi e \sigma^{2}} \end{align*}

다변량 정규분포

다변량 정규분포의 확률밀도함수는 p(x)=1(2π)pΣexp(12(xμ)TΣ1(xμ))p(\mathbf{x}) = \dfrac{1}{\sqrt{(2\pi)^{p} \left| \Sigma \right|}} \exp \left( -\dfrac{1}{2}(\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right)이므로,

H(p)=p(x)ln(p(x))dx=p(x)ln[1(2π)pΣexp(12(xμ)TΣ1(xμ))]=p(x)ln(1(2π)pΣ)dx+12p(x)(xμ)TΣ1(xμ)dx=ln(1(2π)pΣ)p(x)dx+12E[(xμ)TΣ1(xμ)]=ln(1(2π)pΣ)+12E[(xμ)TΣ1(xμ)] \begin{align*} H(p) &= -\int p(\mathbf{x}) \ln(p(\mathbf{x}))d \mathbf{x} \\ &= -\int p(\mathbf{x}) \ln \left[ \dfrac{1}{\sqrt{(2\pi)^{p} \left| \Sigma \right|}} \exp \left( -\dfrac{1}{2}(\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right) \right] \\ &= -\int p(\mathbf{x}) \ln\left( \dfrac{1}{\sqrt{(2\pi)^{p} \left| \Sigma \right|}} \right)d \mathbf{x} + \dfrac{1}{2}\int p(\mathbf{x}) (\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})d \mathbf{x} \\ &= -\ln\left( \dfrac{1}{\sqrt{(2\pi)^{p} \left| \Sigma \right|}} \right)\int p(\mathbf{x}) d \mathbf{x} + \dfrac{1}{2} E \left[ (\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right] \\ &= -\ln\left( \dfrac{1}{\sqrt{(2\pi)^{p} \left| \Sigma \right|}} \right) + \dfrac{1}{2} E \left[ (\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right] \end{align*}

두번째 항은 다음과 같이 계산된다.

E[(xμ)TΣ1(xμ)]=E[tr((xμ)TΣ1(xμ))]=E[tr(Σ1(xμ)(xμ)T)]=tr[E(Σ1(xμ)(xμ)T)]=tr[Σ1E((xμ)(xμ)T)]=tr[Σ1Σ]=tr[Ip×p]=p \begin{align*} E \left[ (\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right] &= E \left[ \tr \left( (\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right) \right] \\ &= E \left[ \tr \left( \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) (\mathbf{x} - \boldsymbol{\mu})^{T} \right) \right] \\ &= \tr \left[ E \left( \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) (\mathbf{x} - \boldsymbol{\mu})^{T} \right) \right] \\ &= \tr \left[ \Sigma^{-1} E \left( (\mathbf{x} - \boldsymbol{\mu}) (\mathbf{x} - \boldsymbol{\mu})^{T} \right) \right] \\ &= \tr \left[ \Sigma^{-1} \Sigma \right] \\ &= \tr \left[ I_{p\times p} \right] \\ &= p \end{align*}

따라서 엔트로피는 다음과 같다.

H(p)=ln(1(2π)pΣ)+12E[(xμ)TΣ1(xμ)]=12ln[(2π)pΣ]+12p=12ln[(2π)pΣ]+12lnep=12ln[(2πe)pΣ] \begin{align*} H(p) &= -\ln\left( \dfrac{1}{\sqrt{(2\pi)^{p} \left| \Sigma \right|}} \right) + \dfrac{1}{2} E \left[ (\mathbf{x} - \boldsymbol{\mu})^{T} \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right] \\ &= \dfrac{1}{2} \ln \left[ (2\pi)^{p} \left| \Sigma \right| \right] + \dfrac{1}{2}p \\ &= \dfrac{1}{2} \ln \left[ (2\pi)^{p} \left| \Sigma \right| \right] + \dfrac{1}{2}\ln e^{p} \\ &= \dfrac{1}{2} \ln \left[ (2\pi e)^{p} \left| \Sigma \right| \right] \end{align*}