피타고리안 승률 유도
📂세이버메트릭스피타고리안 승률 유도
공식
특정 종목 스포츠 리그의 팀 하나가 주어져 있다고 하자. 팀 득점scores S 와 팀 실점allows A 가 각각 베이불 분포를 따르는 확률변수
SA∼Weibull(αS,β,γ)∼Weibull(αA,β,γ)
면서 서로 독립이라 하자. 이 팀의 시즌 기대 승률 p 는 γ>0 에 대해 다음과 같다.
pγ=μSγ+μAγμSγ
여기서 μS:=E(S) 와 μA:=E(A) 는 각각 기대 득점, 기대 실점이다.
유도
전략: 이는 피타고리안 승률에 대한 수리통계적인 유도다. 그냥 정직하게 조인트 확률 밀도 함수로 연역한다. 함수 Γ:R→R 는 감마함수를 나타낸다.
베이불 분포의 평균과 분산: 스케일scale 파라미터 α>0 와 로케이션location 파라미터 β>0 와 쉐이프shape 파라미터 γ>0 에 대해 다음과 같은 확률 밀도 함수를 가지는 확률분포를 세 모수 베이불 분포three-parameter Weibull distribution라 한다.
f(x)=αγ(αx−β)γ−1e−((x−β)/α)γ,x≥β
만약 X∼Weibull(α,β,γ) 면 그 평균과 분산은 다음과 같다.
E(X)=Var(X)=αΓ(1+γ1)+βα2[Γ(1+γ2)−(Γ(1+γ1)2)]
μS=μA=E(S)=αSΓ(1+γ−1)+βE(A)=αAΓ(1+γ−1)+β
S 와 A 의 모평균을 위와 같이 각각 μS 와 μA 라 나타내면, 베이불 분포의 첫번째 모수 αS, αA 는
αS=αA=Γ(1+γ−1)μS−βΓ(1+γ−1)μA−β
와 같이 나타나고, 전개 상의 편의를 위해 다음을 만족하는 α 를 정의하자.
αγ1=αSγ1+αAγ1=αSγαAγαSγ+αAγ
이제 본격적으로 기대승률을 계산해야할 때다. 대부분의 스포츠에서 승리는 득점 S 가 실점 A 보다 큰 사건으로 정의되므로, 기대 승률은 곧 P(S>A) 이다. S, A 각각의 확률밀도함수를 fS, fA 라 하면, S 와 A 가 독립이라는 가정에 따라 그 조인트 확률밀도함수가 fSfA 이다.
==============P(S>A)∫β∞∫βxfS(x)fA(y)dydx∫β∞∫βxαSγ(αSx−β)γ−1e−((x−β)/αS)γαAγ(αAy−β)γ−1e−((y−β)/αA)γdydx∫0∞∫0xαSγ(αSx)γ−1e−(x/αS)γαAγ(αAy)γ−1e−(y/αA)γdydx∫0∞αSγ(αSx)γ−1e−(x/αS)γ[∫0xαAγ(αAy)γ−1e−(y/αA)γdy]dx∫0∞αSγ(αSx)γ−1e−(x/αS)γ[1−e−(x/αA)γ]dx1+∫0∞αSγ(αSx)γ−1e−(x/αS)γ[−e−(x/αA)γ]dx1−∫0∞αSγ(αSx)γ−1exp(−xγ(αSγ1+αAγ1))dx1−∫0∞αSγ(αSx)γ−1exp(−(αx)γ)dx1−αSγαγ∫0∞αγ(αx)γ−1e−(x/α)γdx1−αSγαγ⋅11−αSγ1αSγ+αAγαSγαAγ1−αSγ+αAγαAγαSγ+αAγαSγ(μS−β)γ+(μA−β)γ(μS−β)γ
여기서 β 는 실점과 득점의 최소값을 의미하므로 β=0 이라 두어도 무방하고, 결과적으로 다음을 얻는다.
P(S>A)=μSγ+μAγμSγ
■