베타 분포
📂확률분포론베타 분포
정의

α,β>0 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 Beta(α,β) 를 베타 분포beta distribution라고 한다.
f(x)=B(α,β)1xα−1(1−x)β−1,x∈[0,1]
기초 성질
적률 생성 함수
- [1]: m(t)=1+k=1∑∞(r=0∏k−1α+β+rα+rk!tk),t∈R
- [2]: X∼Beta(α,β) 면
E(X)=Var(X)=α+βα(α+β+1)(α+β)2αβ
- [3]: 베타분포를 따르는 랜덤샘플 X:=(X1,⋯,Xn)∼Beta(α,β) 이 주어져 있다고 하자.
(α,β) 에 대한 충분통계량 T 는 다음과 같다.
T=(i∏Xi,i∏(1−Xi))
정리
- [a]: 두 확률 변수 X1,X2 가 독립이고 X1∼Γ(α1,1), X2∼Γ(α2,1) 이라 하면
X1+X2X1∼beta(α1,α2)
- [b]: 자유도 r1,r2 인 F-분포를 따르는 확률변수 X∼F(r1,r2) 에 대해 다음과 같이 정의된 Y 는 베타분포 Best(2r1,2r2) 를 따른다.
Y:=1+(r1/r2)X(r1/r2)X∼Beta(2r1,2r2)
설명
감마 분포가 감마 함수에서 나왔듯 베타 분포는 베타 함수에서 이름을 따온 분포다. 베타 함수는 다음과 같이 감마 함수와의 관계를 가지고 있어서 감마 함수로 표현할 수도 있다.
B(p,q)=Γ(p+q)Γ(p)Γ(q)
실제로도 감마분포는 베타분포를 유도할 수 있다.
베타 함수가 이항계수의 일반화로 볼 수 있듯, 베타 분포의 확률 밀도 함수를 잘 살펴보면 그 모양새가 이항 분포의 확률 질량 함수 P(k)=nCkpk(1−p)n−k와 닮았음을 알 수 있다. 정확히 베타분포의 정의와 맞아 떨어지는 건 아니지만, α 를 성공 횟수, β 를 실패 횟수라고 생각하면
n=α+βp=α+βαq=α+ββ
로 얼추 비슷한 느낌이 난다. 실제로 베이지안에서는 이항 분포의 켤레사전분포으로 쓰이기도 한다.
증명
[1]
식이 번잡해서 그렇지 논리적으로 어려운 부분은 없다.
지수 함수의 급수 전개:
ex=n=0∑∞n!xn
오일러 적분:
B(p,q)=∫01tp−1(1−t)q−1dt
m(t)======∫01etxB(α,β)1xα−1(1−x)β−1dxB(α,β)1∫01(k=0∑∞k!(tx)k)xα−1(1−x)β−1dxB(α,β)1k=0∑∞k!tk∫01xα+k−1(1−x)β−1dxB(α,β)1k=0∑∞k!tkB(α+k,β)k=0∑∞k!tkB(α,β)B(α+k,β)0!t0B(α,β)B(α+0,β)+k=1∑∞k!tkB(α,β)B(α+k,β)
베타 함수와 감마 함수의 관계: B(p,q)=Γ(p+q)Γ(p)Γ(q)
베타함수를 감마함수로 풀어내보면
m(t)======1+k=1∑∞k!tkB(α,β)B(α+k,β)1+k=1∑∞k!tkΓ(α+β+k)Γ(α+k)Γ(β)Γ(α)Γ(β)Γ(α+β)1+k=1∑∞k!tkΓ(α+β+k)Γ(α+k)Γ(α)Γ(α+β)1+k=1∑∞k!tkΓ(α)Γ(α+k)Γ(α+β+k)Γ(α+β)1+k=1∑∞k!tkΓ(α)Γ(α)∏r=0k−1(α+r)Γ(α+β)∏r=0k−1(α+β+r)Γ(α+β)1+k=1∑∞k!tkr=0∏k−1α+β+rα+r
■
[2]
직접연역한다.
■
[3]
(1−x) 때문에 뭔가 찝찝하겠지만 그냥 직접연역한다.
[a]
확률밀도함수로 직접연역한다.
■
[b]
확률밀도함수로 직접연역한다.
■
코드
다음은 베타분포의 확률밀도함수를 움짤로 보여주는 줄리아 코드다.
@time using LaTeXStrings
@time using Distributions
@time using Plots
cd(@__DIR__)
x = 0:0.01:1
B = collect(0.1:0.1:10.0); append!(B, reverse(B))
animation = @animate for β ∈ B
plot(x, pdf.(Beta(0.5, β), x),
color = :black,
label = "α = 0.5, β = $(rpad(β, 3, '0'))", size = (400,300))
xlims!(0,1); ylims!(0,5); title!(L"\mathrm{pmf\,of\,Beta} (0.5, \beta)")
end
gif(animation, "pdf0.gif")
animation = @animate for β ∈ B
plot(x, pdf.(Beta(1, β), x),
color = :black,
label = "α = 1, β = $(rpad(β, 3, '0'))", size = (400,300))
xlims!(0,1); ylims!(0,5); title!(L"\mathrm{pmf\,of\,Beta} (1, \beta)")
end
gif(animation, "pdf1.gif")
animation = @animate for β ∈ B
plot(x, pdf.(Beta(2, β), x),
color = :black,
label = "α = 2, β = $(rpad(β, 3, '0'))", size = (400,300))
xlims!(0,1); ylims!(0,5); title!(L"\mathrm{pmf\,of\,Beta} (2, \beta)")
end
gif(animation, "pdf2.gif")