二つの正規分布間の相対エントロピー(カルバック・ライブラー発散)
📂確率分布論二つの正規分布間の相対エントロピー(カルバック・ライブラー発散)
公式
二つの正規分布 N(μ,σ2)とN(μ1,σ12)間の相対エントロピー(KLD) は次の通りだ。
DKL(N(μ,σ2)∥N(μ1,σ12))=log(σσ1)+2σ12σ2+(μ−μ1)2−21
二つの多変量正規分布 N(μ,Σ)とN(μ1,Σ1)間の相対エントロピーは次の通りだ。
DKL(N(μ,Σ)∥N(μ1,Σ1))=21[log(∣Σ1∣∣Σ∣)+Tr(Σ1−1Σ)+(μ−μ1)TΣ1−1(μ−μ1)−k]
説明
二つの正規分布間の相対エントロピーは上記の公式通りに閉じた形式で得ることができる。これはコンピュータシミュレーションで相対エントロピーを計算するためにサンプリングをする必要がないという意味なので非常に有用だ。特に機械学習、ディープラーニングなどの学習において大きな利点がある。サンプリングにより計算された値と比較して安定的で正確な値を提供し、計算時間やメモリに関しても効率的だ。
証明
一変量
正規分布:
平均がμ∈R、分散がσ2>0の正規分布 N(μ,σ2)に従う確率密度関数は次の通りだ。
p(x)=2πσ21exp(−2σ2(x−μ)2)
p∼N(μ,σ2)、q∼N(μ1,σ12)としよう。ログ確率密度関数は次の通りだ。
logp=−21log(2πσ2)−2σ2(x−μ)2
したがって、KLDは次のように計算される。
DKL(p∥q)=Ep[−21log(2πσ2)−2σ2(x−μ)2+21log(2πσ12)+2σ12(x−μ1)2]=21log(2πσ22πσ12)+Ep[−2σ2(x−μ)2+2σ12(x−μ1)2]=log(σσ1)−2σ21Ep[(x−μ)2]+2σ121Ep[(x−μ1)2]
ここで、第二項の期待値は分散の定義であるため、Ep[(x−μ)2]=σ2である。第三項は次のように計算される。
Ep[(x−μ1)2]=Ep[((x−μ)+(μ−μ1))2]=Ep[(x−μ)2+2(μ−μ1)(x−μ)+(μ−μ1)2]=Ep[(x−μ)2]+2(μ−μ1)Ep[x−μ]+(μ−μ1)2=σ2+0+(μ−μ1)2
したがって、次のようになる。
DKL(p∥q)=log(σσ1)−2σ21σ2+2σ121(σ2+(μ−μ1)2)=log(σσ1)+2σ12σ2+(μ−μ1)2−21
■
多変量
多変量正規分布:
平均ベクトルがμ∈Rk、共分散行列がΣ∈Rk×kの多変量正規分布 N(μ,Σ)に従う確率密度関数は次の通りだ。
p(x)=(2π)k∣Σ∣1exp(−21(x−μ)TΣ−1(x−μ))
p∼N(μ,Σ)、q∼N(μ1,Σ1)としよう。ログ確率密度関数は次の通りだ。
logp=−21log((2π)k∣Σ∣)−21(x−μ)TΣ−1(x−μ)
したがって、KLDは次のように計算される。
DKL(p∥q)=Ep[−21log((2π)k∣Σ∣)−21(x−μ)TΣ−1(x−μ)+21log((2π)k∣Σ1∣)+21(x−μ1)TΣ1−1(x−μ1)]=21log(∣Σ∣∣Σ1∣)+Ep[−21(x−μ)TΣ−1(x−μ)+21(x−μ1)TΣ1−1(x−μ1)]=21log(∣Σ∣∣Σ1∣)−21Ep[(x−μ)TΣ−1(x−μ)]+21Ep[(x−μ1)TΣ1−1(x−μ1)]
ランダムベクトル二次形式の期待値
x∼N(μ,Σ)であるランダムベクトル xと対称行列 Aについて次が成り立つ。
E[(x−μ)TA(x−μ)]E[(x−μ1)TA(x−μ1)]=tr(AΣ)=tr(AΣ)+(μ−μ1)TA(μ−μ1)
上記の公式により、共分散行列は対称であるため、第二項の期待値はtr(Σ−1Σ)=Tr(I)=kだ。第三項の期待値はTr(Σ1−1Σ)+(μ−μ1)TΣ1−1(μ−μ1)だ。したがって、次のようになる。
DKL(p∥q)=21log(∣Σ∣∣Σ1∣)−21k+21(Tr(Σ1−1Σ)+(μ−μ1)TΣ1−1(μ−μ1))=21[log(∣Σ1∣∣Σ∣)+Tr(Σ1−1Σ)+(μ−μ1)TΣ1−1(μ−μ1)−k]
■