最尤推定量
📂数理統計学最尤推定量
ビルドアップ
パラメータθ∈Θに対して、確率密度関数がf(x;θ)である確率変数Xについて考えよう。同じ確率密度関数f(x;θ)と実現x:=(x1,⋯,xn)を持っている、Xと同じ分布からiidに抽出されたランダムサンプルX1,⋯,Xnがある。これに対して定義された関数Lを、尤度関数likelihood functionと言う。
L(θ;x):=k=1∏nf(xk;θ)
以下で説明する通り、我々はこの関数の最大値に関心があるので、掛け算∏を足し算∑に変えて、ログを取ったlとして表す方が便利である。
l(θ;x):=k=1∑nlogf(xk;θ)
定義
以下を満たす推定量θ^:=θ^(X)を、最尤推定量maximum Likelihood estimator、略してmleと呼ぶ。
θ^=argmaxL(θ;X)
- XはランダムベクターX:=(X1,⋯,Xn)である。
- argmaxgは関数gの最大引数で、gが最大になるような値である。
説明
直感
実際、尤度は英語表現で見る方がもっと直感的で、「ありそうな」を意味する。
例えば、通りで偶然見かけたどんな男性3人の身長を計測したところ、169cm、171cm、182cmだったとしよう。そして、韓国男性の身長は正規分布N(μ,σ2)に従っていると仮定しよう。正規分布の確率密度関数f(x;μ)は平均x=μで最大値を取るので、その関数値の積で定義されるL(θ;x)はθ=μの時に最も大きな値を持つ可能性が高い。
ここで、関数Lの主な引数はデータxではなくθに注目しよう。つまり、Lは、確率密度関数f(x)に入れるxが動きながら値が変わらないが、fθ自体がθによって左右に動きながら変わる関数だと想像するといい。
まだLの性質についてよくわかっていないから、Lが最も大きくなる場所がθ=171だと確信を持って言えないが、確実にθ=182ではない。尤度という言葉やargmaxが見慣れないかもしれないが、実際には最尤推定量とは「最もありそうな値」を指しているのだ。
数式
もしLが微分可能であれば、最尤推定量は次の推定方程式estimating equation、すなわち偏微分方程式を満たす。
∂θ∂l(θ)=0
これはカリキュラムで関数の最大値を求める際に微分を使った解法の延長に過ぎない。ただし、教科書でこの部分を見ると、特に統計学の学生は大学1年生以降に微分方程式を扱うことがほとんどないので、馴染みがなく怖く感じられるかもしれない。しかし実際には微分方程式を解く必要はなく、よく知らなくても大丈夫なので、あまり心配しないでほしい。