logo

数理統計学における尤度比検定の定義 📂数理統計学

数理統計学における尤度比検定の定義

定義 1

H0:θΘ0H1:θΘ0c \begin{align*} H_{0} :& \theta \in \Theta_{0} \\ H_{1} :& \theta \in \Theta_{0}^{c} \end{align*}

上記の仮説検定について、次の統計量 λ\lambda尤度比検定統計量likelihood Ratio test statisticと言う。 λ(x):=supΘ0L(θx)supΘL(θx) \lambda \left( \mathbf{x} \right) := {{ \sup_{\Theta_{0}} L \left( \theta \mid \mathbf{x} \right) } \over { \sup_{\Theta} L \left( \theta \mid \mathbf{x} \right) }}

与えられたc[0,1]c \in [0,1]に対して棄却域 {x:λ(x)c}\left\{ \mathbf{x} : \lambda \left( \mathbf{x} \right) \le c \right\} を持つすべての仮説検定を 尤度比検定likelihood Ratio testと言い、通常、LRTと略す。


説明

λ\lambda の定義で、分子はsupΘ0\sup_{\Theta_{0}}で、分母はsupΘ\sup_{\Theta}スプレマムを探している。帰無仮説下の部分パラメータ空間Θ0\Theta_{0}は全パラメータ空間の部分集合Θ0Θ\Theta_{0} \subseteq \Thetaで、自然に0λ(x)10 \le \lambda \left( \mathbf{x} \right) \le 1が成立する。この比が00に近いということは、その分、帰無仮説下でのパラメータがそんなにもっともらしくないという意味になる。

統計学を初めて学ぶ時に、基本的な確率分布論から始めて、t分布、F分布、カイ二乗分布などの検定統計量を別々に学ぶよりずっとわかりやすいと感じるだろう。もちろん、尤度比検定にはそれなりのモチベーションがあるが、前述の検定と違って、どんなビルドアップもなくても話が通じる。

例: 正規分布

実際にLRTを行う場合は、スプレマムsup\supが反映された状態でなければならない。分母はパラメータ空間Θ\Theta全体で最大になるので、最尤推定量を使用し、分子は帰無仮説下で最大になるように設定する。 H0:θ=θ0H1:θθ0 \begin{align*} H_{0} :& \theta = \theta_{0} \\ H_{1} :& \theta \ne \theta_{0} \end{align*} 分散が既知の正規分布N(θ,σ2)N \left( \theta , \sigma^{2} \right)のランダムサンプルX1,,XnX_{1} , \cdots , X_{n}に対して、上記の仮説検定を考えよう。ここで、分母は母平均θ\thetaに対する最尤推定量である標本平均xˉ\bar{\mathbf{x}}を使用しなければならず、分子は帰無仮説のパラメータ空間が単集合Θ0={θ0}\Theta_{0} = \left\{ \theta_{0} \right\}であるため、θ0\theta_{0}をそのまま使用すればよい。数式的に次のように求められる。 λ(x)=supΘ0L(θx)supΘL(θx)=L(θ0x)L(xˉx)=(2π)n/2exp((xkθ0)2/2)(2π)n/2exp((xkxˉ)2/2)=exp(n(xˉθ0)2/2) \begin{align*} \lambda \left( \mathbf{x} \right) =& {{ \sup_{\Theta_{0}} L \left( \theta \mid \mathbf{x} \right) } \over { \sup_{\Theta} L \left( \theta \mid \mathbf{x} \right) }} \\ =& {{ L \left( \theta_{0} \mid \mathbf{x} \right) } \over { L \left( \bar{\mathbf{x}} \mid \mathbf{x} \right) }} \\ =& {{ (2\pi)^{-n/2} \exp \left( - \sum \left( x_{k} - \theta_{0} \right)^{2} / 2 \right) } \over { (2\pi)^{-n/2} \exp \left( - \sum \left( x_{k} - \bar{\mathbf{x}} \right)^{2} / 2 \right) }} \\ =& \exp \left( -n \left( \bar{\mathbf{x}} - \theta_{0} \right)^{2} / 2 \right) \end{align*} このとき、λ(x)\lambda (\mathbf{x})は正確にxˉ=θ0\bar{\mathbf{x}} = \theta_{0}のとき11であり、差が大きくなるほど00に近づくことに注意しよう。もちろん、LRTの数式的な定義では、00から11までであることは分かっているが、計算された結果を見ると、実際に標本分散が帰無仮説下の母平均とどれほど類似しているかに応じて、直感的に仮説検定を行うことができる。


  1. Casella. (2001). Statistical Inference(2nd Edition): p375. ↩︎