logo

R 에서 여러가지 분포함수 📂R

R 에서 여러가지 분포함수

설명

R 에서 특정 분포에 대한 함수들은 다음과 같은 접두어와 접미어의 조합으로 만들어진다.

접두

확률분포 $X$ 의 확률분포함수를 $f(x)$ 라고 하자.

  • r-:랜덤 추출, 확률분포 $X$ 에서 나온 $x_{1}, \cdots , x_{n}$ 을 생각하면 좋다.
  • d-: 분포함수, $f(x)$
  • p-: 누적분포함수, $F(x) = \displaystyle \int_{\infty}^{x} f(t) dt$
  • q-: 분위수함수, $F^{-1}(\alpha)$

접미

이름이 알려진 분포는 거의 다 있지만 특히 자주 쓰는 분포는 아래와 같다.

  • -norm: 정규분포
  • -t: t-분포
  • -f: F-분포
  • -chisq: 카이제곱분포더 다양한 분포에 대해 알고싶다면 콘솔창에 ?distribution을 입력하면 된다.

20180604\_131932.png

랜덤추출 함수의 첫번째 인수는 무조건 몇개를 뽑을까에 대한 것이고 구체적인 파라미터의 조정은 분포마다 다르다. 분포함수는 주어진 $x$ 에 대해서 그냥 함숫값을 반환하므로 아래와 같이 plot()을 쓰면 확률밀도함수의 그래프가 그려진다.누적분포함수는 주어진 $x$ 까지 적분한 값을 반환하므로 잘 알다시피 $x=1.96$ 에 대해 $0.975$ 을 반환했다. 분위수함수는 주어진 $\alpha$ 에 대해 분위수를 반환하므로 잘 알다시피 $\alpha = 95%$ 에 대해 $1.65$ 를 반환했다.

1232.png

코드

아래는 예제 코드다.

set.seed(150421)
rnorm(4)
pnorm(1.96)
qnorm(0.95)
dnorm(0)
win.graph()
plot(dnorm,xlim=c(-3,3))