R 에서 여러가지 분포함수
설명
R 에서 특정 분포에 대한 함수들은 다음과 같은 접두어와 접미어의 조합으로 만들어진다.
접두
확률분포 $X$ 의 확률분포함수를 $f(x)$ 라고 하자.
- r-:랜덤 추출, 확률분포 $X$ 에서 나온 $x_{1}, \cdots , x_{n}$ 을 생각하면 좋다.
- d-: 분포함수, $f(x)$
- p-: 누적분포함수, $F(x) = \displaystyle \int_{\infty}^{x} f(t) dt$
- q-: 분위수함수, $F^{-1}(\alpha)$
접미
이름이 알려진 분포는 거의 다 있지만 특히 자주 쓰는 분포는 아래와 같다.
- -norm: 정규분포
- -t: t-분포
- -f: F-분포
- -chisq: 카이제곱분포더
다양한 분포에 대해 알고싶다면 콘솔창에
?distribution
을 입력하면 된다.
랜덤추출 함수의 첫번째 인수는 무조건 몇개를 뽑을까에 대한 것이고 구체적인 파라미터의 조정은 분포마다 다르다. 분포함수는 주어진 $x$ 에 대해서 그냥 함숫값을 반환하므로 아래와 같이 plot()
을 쓰면 확률밀도함수의 그래프가 그려진다.누적분포함수는 주어진 $x$ 까지 적분한 값을 반환하므로 잘 알다시피 $x=1.96$ 에 대해 $0.975$ 을 반환했다. 분위수함수는 주어진 $\alpha$ 에 대해 분위수를 반환하므로 잘 알다시피 $\alpha = 95%$ 에 대해 $1.65$ 를 반환했다.
코드
아래는 예제 코드다.
set.seed(150421)
rnorm(4)
pnorm(1.96)
qnorm(0.95)
dnorm(0)
win.graph()
plot(dnorm,xlim=c(-3,3))