코시 분포: 모평균이 존재하지 않는 분포
정의
다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $C$ 를 코시 분포라고 한다. $$ f(x) = {1 \over \pi} {1 \over {x^2 + 1}} \qquad , x \in \mathbb{R} $$
설명
모든 확률 분포가 평균과 분산을 가질 것 같지만 실제로는 그렇지 않다. 그 대표적인 예시가 코시 분포로, 언뜻 정규 분포와 닮았지만 양쪽 꼬리가 두꺼운 모양을 하고 있다. 모수에 무관하게 적률생성함수가 존재하지 않으니 모평균이든 모분산이든 모멘트가 포함된 모든 것은 존재할 수 없다.
물론 모평균이 있든 말든 표본평균은 구할 수 있다. 실제로 $x$ 축에 대해 $\theta$ 만큼 평행이동한 코시분포에서 $\theta$ 의 mle $\hat{\theta}$ 는 표본평균으로 나타난다.
한편 t-분포의 확률밀도함수는 $$ g(y) = {{\Gamma ( (n+1)/2 ) } \over { \sqrt{\pi n} \Gamma (n/2) }} { {1} \over {(1 + y^{2} / n)^{(n+1)/2} } } $$ 으로, 코시분포는 자유도가 $n=1$ 인 t-분포로 볼 수도 있다.
정리
코시 분포의 적률생성함수는 존재하지 않는다.
증명1
코시 분포의 확률분포함수는 $\displaystyle f(x) = {1 \over \pi} {1 \over {x^2 + 1}}, -\infty < x < \infty$ 로 주어진다. 우리는 적률생성함수 $\displaystyle E(e^{tx}) = \int_{-\infty}^{\infty} e^{tx} {1 \over \pi} {1 \over {x^2 + 1}} dx$ 가 발산함을 보이면 된다.
$t>0$일 때 $e^{tx}$ 에 대해 생각해보면, 평균값 정리에 의해 $$ {{e^{tx} - e^0} \over {tx - 0}} = { { e^{tx} - 1 } \over {tx} } = e^{\xi} \ge e^0 = 1 $$ 을 만족하는 $0< \xi < tx$ 가 존재한다. 위 식을 조금 정리해보면 다음의 부등식을 얻는다. $$ e^{tx} \ge 1 + tx \ge tx $$ 다시 적분으로 돌아가보면 $$ \begin{align*} E(e^{tx}) \ge& \int_{-\infty}^{\infty} e^{tx} {1 \over \pi} {1 \over {x^2 + 1}} dx \\ \ge& \int_{0}^{\infty} e^{tx} {1 \over \pi} {1 \over {x^2 + 1}} dx \\ \ge& \int_{0}^{\infty} {1 \over \pi} {tx \over {x^2 + 1}} dx \\ =& { t \over {2 \pi} } \left[ \ln (x^2+1) \right]_{0}^{\infty} \\ =& \infty \end{align*} $$ 따라서 코시분포의 적률생성함수는 존재하지 않는다.
■
코드
다음은 코시분포, t-분포, 코시분포의 확률밀도함수를 보여주는 줄리아 코드다.
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__)
x = -4:0.1:4
plot(x, pdf.(Cauchy(), x),
color = :red,
label = "Cauchy", size = (400,300))
plot!(x, pdf.(TDist(3), x),
color = :orange,
label = "t(3)", size = (400,300))
plot!(x, pdf.(TDist(30), x),
color = :black, linestyle = :dash,
label = "t(30)", size = (400,300))
plot!(x, pdf.(Normal(), x),
color = :black,
label = "Standard Normal", size = (400,300))
xlims!(-4,5); ylims!(0,0.5); title!(L"\mathrm{pdf\,of\, t}(\nu)")
png("pdf")
Hogg et al. (2013). Introduction to Mathematical Statistcs(7th Edition): p63. ↩︎