ロジスティック回帰分析
📂統計的分析ロジスティック回帰分析
ビルドアップ
Y←X1,⋯,Xp をやってみようと思う。ここで、Y は質的変数で、中でもクラスが2つしかない場合がある。例えば、男性と女性、成功と失敗、陽性と陰性、0 と1 などがあり、便宜上、単にY=0 やY=1 と呼ぼう。このように従属変数が2値の場合、興味があるのは’独立変数 X1,⋯Xp を見たときにY が何か’である。
しかし、Y は質的変数なので、通常の回帰分析とは異なり、回帰係数と変数の線形結合 y=β0+β1x1+⋯βpxp で表現することができない。そのため、Y=1 になる確率を計算する方向でアプローチしようとする。
与えられた X=x に対して、Y=1 になる確率を以下のように設定する。
π:=P(Y=1∣X=x)=1+eβ0+β1x1+⋯βpxpeβ0+β1x1+⋯βpxp
- (i) 指数関数は常に 0 より大きく、π の分母が分子より大きいので 0<π<1 である。
- (ii) 自然に、Y=0になる確率は
1−π===P(Y=0∣X=x)1−1+eβ0+β1x1+⋯βpxpeβ0+β1x1+⋯βpxp1+eβ0+β1x1+⋯βpxp1 であり、したがって 1−ππ=1+eβ0+β1x1+⋯βpxp11+eβ0+β1x1+⋯βpxpeβ0+β1x1+⋯βpxp=eβ0+β1x1+⋯βpxp だ。両辺に自然対数を取ると ln(1−ππ)=β0+β1x1+⋯βpxp になる。
このように対数を取ることをロジット変換と呼び、ln(1−ππ) をロジットと呼ぶ。
モデル
ロジットを従属変数とした多重回帰分析 ln(1−ππ)←X1,⋯,Xp をロジスティック回帰分析と呼ぶ。
ロジスティックモデルで得られた値にロジット変換の逆変換を適用することで、もともと知りたかった確率 π を得ることができる。この時、Xi の係数 βi が正であるということは、Xi が大きくなるにつれて、Y=1 になる確率も大きくなることを意味し、負であることは、Xi が大きくなるにつれて、Y=0 になる確率も大きくなることを意味する。
また、ロジスティック回帰分析は与えられた条件に対して結果が起こる確率を教えてくれるので予測技術であると同時に、確率に対して適切な閾値を提案することで分類技術にもなり得る。
一緒に見る