수리통계적인 우도비검정의 정의
📂수리통계학수리통계적인 우도비검정의 정의
정의
H0:H1:θ∈Θ0θ∈Θ0c
위와 같은 가설검정에 대해 다음의 통계량 λ 를 우도비검정 통계량likelihood Ratio test statistic이라 한다.
λ(x):=supΘL(θ∣x)supΘ0L(θ∣x)
주어진 c∈[0,1] 에 대해 기각역 {x:λ(x)≤c} 를 가지는 모든 가설검정을 우도비검정likelihood Ratio test이라 하고, 주로 줄여서 LRT라 한다.
설명
λ 의 정의에서 분자는 supΘ0, 분모는 supΘ 에서 슈프리멈을 찾고 있다. 귀무가설 하의 부분모수공간 Θ0 는 전체모수공간의 부분집합 Θ0⊆Θ 고, 자연스럽게 0≤λ(x)≤1 이 성립한다. 이 비가 0 에 가깝다는 것은 그만큼 귀무가설 하에서 모수가 그럴싸하지 않다는 뜻이 된다.
여기까지 공부한 입장에서 통게학을 처음 접하던 그 시절을 돌이켜보면, 기초적인 확률분포론에서 시작해 t-분포, F-분포, 카이제곱분포 등의 검정통계량 같은 걸 따로따로 공부하는 것보다 훨씬 깔끔하다는 생각이 들 것이다. 물론 우도비검정에도 나름의 모티브는 있지만, 앞서 언급한 검정들과 달리 어떤 빌드업 없이도 말이 된다.
예시: 정규분포
하나편 실제로 LRT로 구해야 할 때는 슈프리멈 sup 이 반영된 상태여야한다. 분모는 모수공간 Θ 전체에서 가장 커지므로 최대우도추정량을 사용하고, 분자는 귀무가설 하에서 가장 커지게 세팅한다.
H0:H1:θ=θ0θ=θ0
분산이 알려진 정규분포 N(θ,σ2) 의 랜덤샘플 X1,⋯,Xn 에 대해 위와 같은 가설검정을 생각해보자. 여기서 분모는 모평균 θ 에 대한 최대우도추정량인 표본평균 xˉ 을 사용해야할 것이고, 분자는 귀무가설의 모수공간이 홑원소 집합 Θ0={θ0} 이므로 θ0 를 그대로 사용하면 된다. 수식적으로 다음과 같이 구해진다.
λ(x)====supΘL(θ∣x)supΘ0L(θ∣x)L(xˉ∣x)L(θ0∣x)(2π)−n/2exp(−∑(xk−xˉ)2/2)(2π)−n/2exp(−∑(xk−θ0)2/2)exp(−n(xˉ−θ0)2/2)
이 때 λ(x) 는 정확히 xˉ=θ0 일 때 1 이고, 차이가 커질수록 0 에 가까워진다는 것에 주목하자. 물론 LRT의 수식적인 정의에서 당연히 0 부터 1 까지인 것은 알지만, 계산된 결과를 보면 실제로 표본분산이 귀무가설 하의 모평균과 얼마나 비슷한지에 따라 직관적으로 가설검정을 할 수 있다.