logo

둡의 최대 부등식 증명 📂확률론

둡의 최대 부등식 증명

정리

확률 공간 (Ω,F,P)( \Omega , \mathcal{F} , P)서브 마틴 게일 {(Xn,Fn)}\left\{ ( X_{n} , \mathcal{F}_{n} ) \right\} 이 주어져 있다고 하자.

어떤 NNN \in \mathbb{N}p>1p>1 에 대해 Xn0(nN)X_{n} \ge 0 (n \le N), EXNp<E X_{N}^{p} < \infty 이면 E(maxnNXnp)(pp1)pEXNp a.s. E \left( \max_{n \le N} X_{n}^{p} \right) \le \left( {{ p } \over { p-1 }} \right)^{p} E X_{N}^{p} \text{ a.s.}

설명

수식의 모양은 maxnNnp\displaystyle \max_{n \le N} \cdot_{n} ^{p} 으로 말미암아 생기는 (pp1)p\displaystyle \left( {{ p } \over { p-1 }} \right)^{p} 을 밖으로 빼내고 그 상한을 계산하는 것으로 볼 수 있다. (pp1)>1\displaystyle \left( {{ p } \over { p-1 }} \right)>1 이기 때문에 pp 가 너무 크면 부등식으로서 가치가 떨어지며, 마지막 수 NN 이 커도 된다는 것이 중요하다. 이론을 넘어 통계학에 실전적으로 응용할 땐 이 NN 을 제법 크게 잡아도 되기 때문에 NN 이 한정되어 있다는 것에 특별히 신경 쓰지는 않는다.

증명

전략: 우선 상수 LL 에 대해 (LmaxnNXnp)\displaystyle \left( L \land \max_{n \le N} X_{n} ^{p} \right) 을 잡아 LL 을 기준으로 값을 잘라내서 수식 전개를 한다. 여기서 \land 은 두 함수 f,gf,g 에 대해 (fg)(x):=min{f(x),g(x)}\displaystyle (f \land g) (x):= \min \left\{ f(x) , g(x) \right\} 를 의미한다. 여러가지 트릭을 통해 마음에 드는 식을 얻은 뒤 LL 을 무한대로 보내면 결국 maxnNXnp=maxnNXnp\displaystyle \infty \land \max_{n \le N} X_{n} ^{p} = \max_{n \le N} X_{n} ^{p} 만 남게 될 것이다.


Part 1.

Y:=maxnNXn\displaystyle Y:= \max_{n \le N} X_{n} 이라 두고 모든 nNn \in \mathbb{N} 에 대해 Ln+1>LnL_{n+1} > L_{n} 을 만족하는 증가 수열 {Ln}\left\{ L_{n} \right\} 을 생각해보자.

EX=0P(X>t)dt EX = \int_{0}^{\infty} P(X>t) dt

t:=λpt:= \lambda^{p} 라고 두면 기대값의 다른 표현에 따라 E[(YLn)p]=0P[(YLn)p>t]dt=0P[(YLn)p>λp]pλp1dλ=0P(YLn>λ)pλp1dλ=0LnP(YLn>λ)pλp1dλ \begin{align*} E \left[ \left( Y \land L_{n} \right)^{p} \right] =& \int_{0}^{\infty} P \left[ \left( Y \land L_{n} \right)^{p} > t \right] dt \\ =& \int_{0}^{\infty} P \left[ \left( Y \land L_{n} \right)^{p} > \lambda^{p} \right] p \lambda^{p-1} d \lambda \\ =& \int_{0}^{\infty} P \left( Y \land L_{n} > \lambda \right) p \lambda^{p-1} d \lambda \\ =& \int_{0}^{L_{n}} P \left( Y \land L_{n} > \lambda \right) p \lambda^{p-1} d \lambda \end{align*} 여기서 적분구간을 [0,][0,\infty] 에서 [0,Ln][0,L_{n}] 으로 줄여도 되는 이유는 어차피 0λLn0 \le \lambda \le L_{n} 이면 P(YLn>λ)P \left( Y \land L_{n} > \lambda \right) 을 다루고 있어서 \infty 까지 생각할 필요가 없기 때문이다. 한편 증명의 막바지에 LnL_{n} 을 무한대로 보낼 것이기 때문에 Ln<λL_{n} < \lambda 인 경우는 더더욱 생각할 필요가 없다.


Part 2.

{(Xn,Fn)}\left\{ (X_{n} , \mathcal{F}_{n}) \right\} 이 서브 마틴게일이면 모든 λ>0\lambda > 0 에 대해 λP(maxnNXnλ)(maxnNXnλ)XNdP \lambda P \left( \max_{n \le N} X_{n} \ge \lambda \right) \le \int_{(\max_{n \le N} X_{n} \ge \lambda)} X_{N} dP

0λLn0 \le \lambda \le L_{n} 이면 어차피 YLnY \ge L_{n} 이고 서브 마틴게일에 대한 부등식 [3]에 따라 P(Yλ)(Yλ)XNdP\displaystyle P \left( Y \ge \lambda \right) \le \int_{(Y \ge \lambda)} X_{N} dP 이므로 E[(YLn)p]0LnP(YLn>λ)pλp1dλ0LnP(Yλ)pλp1dλ0Ln1λ(Yλ)XNdPpλp1dλp0Ln(Yλ)XNλp2dPdλ \begin{align*} E \left[ \left( Y \land L_{n} \right)^{p} \right] \le & \int_{0}^{L_{n}} P \left( Y \land L_{n} > \lambda \right) p \lambda^{p-1} d \lambda \\ \le & \int_{0}^{L_{n}} P \left( Y \ge \lambda \right) p \lambda^{p-1} d \lambda \\ \le & \int_{0}^{L_{n}} {{ 1 } \over { \lambda }} \int_{(Y \ge \lambda)} X_{N} dP p \lambda^{p-1} d \lambda \\ \le & p \int_{0}^{L_{n}} \int_{(Y \ge \lambda)} X_{N} \lambda^{p-2} dP d \lambda \end{align*}


Part 3.

푸비니 정리에 따라 E[(YLn)p]p0Ln(Yλ)XNλp2dPdλpΩ0YLnXNλp2dλdP=pΩXN0YLnλp2dλdP=pΩXN1p1(YLn)p1dP=pp1ΩXN(YLn)p1dP=pp1E[XN(YLn)p1] \begin{align*} E \left[ \left( Y \land L_{n} \right)^{p} \right] \le & p \int_{0}^{L_{n}} \int_{(Y \ge \lambda)} X_{N} \lambda^{p-2} dP d \lambda \\ \le & p \int_{\Omega} \int_{0}^{ Y \land L_{n}} X_{N} \lambda^{p-2} d \lambda dP \\ =& p \int_{\Omega} X_{N} \int_{0}^{ Y \land L_{n}} \lambda^{p-2} d \lambda dP \\ =& p \int_{\Omega} X_{N} {{ 1 } \over { p-1 }} \left( Y \land L_{n} \right)^{p-1} dP \\ =& {{ p } \over { p-1 }} \int_{\Omega} X_{N} \left( Y \land L_{n} \right)^{p-1} dP \\ =& {{ p } \over { p-1 }} E \left[ X_{N} \left( Y \land L_{n} \right)^{p-1} \right] \end{align*}

횔더 부등식: p>1p>1 에 대해 1p+1q=1\displaystyle {{1} \over {p}} + {{1} \over {q}} = 1 이고 fLp(E)f \in \mathcal{L}^{p} (E) , gLq(E)g \in \mathcal{L}^{q} (E)fgL1(E)fg \in \mathcal{L}^{1} (E) 그리고 fg1fpgq| fg |_{1} \le | f |_{p} | g |_{q}

q:=pp1\displaystyle q: = {{ p } \over { p-1 }} 이라고 두면 q(p1)=pq (p-1) = p 이고, 횔더 부등식에 따라 E[(YLn)p]pp1E[XN(YLn)p1]pp1XN(YLn)p11qXNp(YLn)p1qq[EXNp]1/pE[(YLn)(p1)q]1/qq[EXNp]1/pE[(YLn)p]1/q \begin{align*} E \left[ \left( Y \land L_{n} \right)^{p} \right] \le & {{ p } \over { p-1 }} E \left[ X_{N} \left( Y \land L_{n} \right)^{p-1} \right] \\ \le & {{ p } \over { p-1 }} \left\| X_{N} \left( Y \land L_{n} \right)^{p-1} \right\|_{1} \\ \le & q \left\| X_{N} \right\|_{p} \left\| \left( Y \land L_{n} \right)^{p-1} \right\|_{q} \\ \le & q \left[ E X_{N}^{p} \right]^{1/p} E \left[ \left( Y \land L_{n} \right)^{(p-1) \cdot q} \right]^{1/q} \\ \le & q \left[ E X_{N}^{p} \right]^{1/p} E \left[ \left( Y \land L_{n} \right)^{p} \right]^{1/q} \end{align*} 양변을 E[(YLn)p]1/q\displaystyle E \left[ \left( Y \land L_{n} \right)^{p} \right]^{1/q} 로 나누면 E[(YLn)p]11/qq[EXNp]1/p E \left[ \left( Y \land L_{n} \right)^{p} \right]^{1-1/q} \le q \left[ E X_{N}^{p} \right]^{1/p} 양변에 pp 승을 취하면 11/q=1(p1)/p=1/p1 - 1/q = 1 - (p-1)/p = 1/p 이므로 E[(YLn)p]qp[EXNp] E \left[ \left( Y \land L_{n} \right)^{p} \right] \le q^{p} \left[ E X_{N}^{p} \right] 양변에 극한을 취하면 limnE[(YLn)p]limnqp[EXNp] \lim_{n \to \infty} E \left[ \left( Y \land L_{n} \right)^{p} \right] \le \lim_{n \to \infty} q^{p} \left[ E X_{N}^{p} \right] nn \to \infty 일 때 YLnYY \land L_{n} \nearrow Y 이므로 단조 수렴 정리에 따라 Elimn[(YLn)p]qp[EXNp] E \lim_{n \to \infty} \left[ \left( Y \land L_{n} \right)^{p} \right] \le q^{p} \left[ E X_{N}^{p} \right] 식을 정리하면 EYpqp[EXNp] E Y^{p} \le q^{p} \left[ E X_{N}^{p} \right]