Mean and Variance
1-18. 평균과 분산
평균(Expectation)
- 기댓값이란?
- 우리가 아는 평균은 산술 평균이고 이를 무한 번 반복하여 산술 평균을 낸 것이 기댓값. 즉, 확률 분포의 평균이다.
- $E[X] = \sum\limits_{i}x_iP_i = \int^\infty_{-\infty} xp(x) dx = \mu_x$
분산(Variance)
- 평균으로 부터 퍼진 정도
- $V[X] = \sum\limits_i(x_i - \mu)^2p_i \enspace \text{ if discrete}$
- $V[X] = \int_{-\infty}^{\infty}(x-\mu)^2p(x)dx \enspace \text{ if continuous}$
평균으로 분산 구하기
$V[X] = E[(X-\mu)^2]$
$= E[X^2-2X\mu+\mu^2]$
$= E[X^2]-2E[X]\mu + \mu^2$ $\implies E[aX+bY+c] = aE[X]+bE[Y]+c$
$= E[X^2] - 2\mu^2 + \mu^2$
$=E[X^2]-\mu^2$
표준편차 (Standard Deviation)
$\sigma = \sqrt{V[X]}$
→ 단위를 맞춰주기 위해 존재