確率分布のヘリンガー距離
定義
次のように定義される確率分布自体の距離関数をヘリンガー距離Hellinger distanceと呼ぶ。
離散型1
を確率質量関数とする。のヘリンガー距離を次のように定義する。
連続型2
を確率密度関数とする。のヘリンガー距離を次のように定義する。
説明
ヘリンガー距離は定義通り、確率質量関数または確率密度関数自体を比較する距離関数であり、に境界付けられ、完全に同じ時は、完全に一致しない時はとなる。もちろん確率分布を比較するためには主にクルバック・ライブラー発散が広く使われているが、ヘリンガー距離は厳密な意味でも距離関数なので、距離空間を論じることができるという違いがある。
関連項目
Gingold, J.A., Coakley, E.S., Su, J. et al. Distribution Analyzer, a methodology for identifying and clustering outlier conditions from single-cell distributions, and its application to a Nanog reporter RNAi screen. BMC Bioinformatics 16, 225 (2015). https://doi.org/10.1186/s12859-015-0636-7 ↩︎
Wibisono. (2024). Optimal score estimation via empirical Bayes smoothing. https://doi.org/10.48550/arXiv.2402.07747 ↩︎