F-분포에서 베타 분포 유도

F-분포에서 베타 분포 유도

Derivation of Beta Distribution from F-Distribution

정리 1

자유도 $r_{1} , r_{2}$ 인 F-분포를 따르는 확률변수 $X \sim F \left( r_{1}, r_{2} \right)$ 에 대해 다음과 같이 정의된 $Y$ 는 베타분포 $\text{Best} \left( {{ r_{1} } \over { 2 }} , {{ r_{2} } \over { 2 }} \right)$ 를 따른다. $$ Y := {{ \left( r_{1} / r_{2} \right) X } \over { 1 + \left( r_{1} / r_{2} \right) X }} \sim \text{Beta} \left( {{ r_{1} } \over { 2 }} , {{ r_{2} } \over { 2 }} \right) $$

증명

전략: 확률밀도함수로 직접연역한다.

F-분포의 정의: 자유도 $r_{1}, r_{2} > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $F \left( r_{1} , r_{2} \right)$ 를 F-분포라고 한다. $$ f(x) = {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} \qquad , x \in (0, \infty) $$

베타 분포의 정의: $\alpha , \beta > 0$ 에 대해 다음과 같은 확률 밀도 함수를 가지는 연속 확률 분포 $\text{Beta}(\alpha,\beta)$ 를 베타 분포라고 한다. $$ f(x) = {{ 1 } \over { B(\alpha,\beta) }} x^{\alpha - 1} (1-x)^{\beta - 1} \qquad , x \in [0,1] $$


$$ \begin{align*} & Y = {{ \left( r_{1} / r_{2} \right) X } \over { 1 + \left( r_{1} / r_{2} \right) X }} \\ \implies & Y \left( 1 + \left( r_{1} / r_{2} \right) X \right) = \left( r_{1} / r_{2} \right) X \\ \implies & Y = \left( r_{1} / r_{2} \right) X (1 - Y) \\ \implies & \left( r_{1} / r_{2} \right) X = {{ Y } \over { 1 - Y }} \end{align*} $$ 이고 $$ \begin{align*} dy =& \left[ {{ \left( r_{1} / r_{2} \right) } \over { 1 + \left( r_{1} / r_{2} \right) x }} - \left( r_{1} / r_{2} \right) {{ \left( r_{1} / r_{2} \right) x } \over { \left[ 1 + \left( r_{1} / r_{2} \right) x \right]^{2} }} \right] dx \\ =& {{ \left( r_{1} / r_{2} \right) } \over { 1 + \left( r_{1} / r_{2} \right) x }} \left[ {{ 1 + \left( r_{1} / r_{2} \right) x } \over { 1 + \left( r_{1} / r_{2} \right) x }} - {{ \left( r_{1} / r_{2} \right) x } \over { 1 + \left( r_{1} / r_{2} \right) x }} \right] dx \\ =& {{ \left( r_{1} / r_{2} \right) } \over { \left[ 1 + \left( r_{1} / r_{2} \right) x \right]^{2} }} dx \end{align*} $$ 이므로 $Y$ 의 확률밀도함수 $f_{Y}$ 는 $$ \begin{align*} & B \left( r_{1}/2 , r_{2} / 2 \right) f_{Y} (y) \\ =& \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{-(r_{1} + r_{2}) / 2} \cdot {{ \left[ 1 + \left( r_{1} / r_{2} \right) x \right]^{2} } \over { \left( r_{1} / r_{2} \right) }} \\ =& \left( {{ r_{1} } \over { r_{2} }} \right)^{r_{1} / 2 - 1} x^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{2-(r_{1} + r_{2}) / 2} \\ =& \left( {{ r_{1} } \over { r_{2} }} x \right)^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{2-(r_{1} + r_{2}) / 2} \\ =& y^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{2-(r_{1} + r_{2}) / 2} \\ =& y^{r_{1} / 2 - 1} \left( 1 + {{ r_{1} } \over { r_{2} }} x \right)^{1 - r_{2} / 2} \\ =& y^{r_{1} / 2 - 1} \left( 1 + {{ y } \over { 1 - y }} \right)^{1 - r_{2} / 2} \\ =& y^{r_{1} / 2 - 1} \left( {{ 1 } \over { 1 - y }} \right)^{1 - r_{2} / 2} \\ =& y^{r_{1} / 2 - 1} \left( 1 - y \right)^{r_{2} / 2 - 1} \end{align*} $$ 정리하면 $Y$ 는 다음과 같이 $\text{Beta} \left( {{ r_{1} } \over { 2 }} , {{ r_{2} } \over { 2 }} \right)$ 의 확률밀도함수를 가진다. $$ f_{Y} (y) = {{ 1 } \over { B \left( r_{1}/2 , r_{2} / 2 \right) }} y^{r_{1} / 2 - 1} \left( 1 - y \right)^{r_{2} / 2 - 1} $$


  1. Casella. (2001). statistiical Inference(2nd Edition): p225. ↩︎

댓글