1. 기대값 (Expectation)
ㅇ 기대값은 단순한 평균 그 이상으로 일반화된 개념 임
- 예측/추정하려는 어떤 특정값이 아닌,
- 기대되는 예측치들의 평균값
ㅇ 즉, 확률적 분포 개념이 고려된 평균 임
- 확률분포의 성격을 결정짓는 확률적 평균치 (무게중심, 균형점)
- 확률변수가 나타내는 확률분포에서, 중심 경향 / 기대되는 위치
. (즉, 중심점으로 기대되는 대표 값)
ㅇ 결국, 확률분포를 담고있는 확률변수에 취해지는 확률적 가중평균 임
[# E[X] = \sum^n_{i=1} x_i P(x_i) #]
2. 기대값, 평균 비교
ㅇ 기대값(Expected Value)
- 이따금, 평균(Mean Value)과 같은 의미로 잘못 사용됨
- 기대값은 모집단에 대한 통계적 파라미터 중 하나로써 기대되는 예측치들의 평균값을 의미
. 즉, 모집단 확률분포의 모수에 대한 무게중심으로 기대되는 값
ㅇ 결국,
- 기대값은 매 표본 집단 마다 얻어지는 표본 평균들에 대한 일반화임
. 시행횟수 n -> ∞ 이면, 표본평균은 모집단(확률변수)의 기대값에 수렴 ☞ 대수의 법칙
ㅇ (기대값,평균의 표기를 달리하는 관례)
- 확률변수 X에 대한 기대값(Expectation) 표기 : E[X] 또는 < X >
- 확률변수 X에 대한 평균(Mean) 표기 : {# \overline{X} #} 또는 {# μ_X #}
3. 기대값 정의 식
※ 확률변수에 의한 확률밀도함수,확률질량함수 등과 관련된
적분식(integral) 또는 합(summation)으로써 정의/계산됨
[# E[X] = \left\{ \begin{array}{ll}
\sum_i x_ip_{{\tiny X}}(x_i) & (discrete) \\
& \\
\int xf_X(x)dx & (continuous)
\end{array}
\right. #]
ㅇ 이산 확률변수의 기대값
[# E[X] = \sum_{x_i \in S_X} x_i p_X(x_i) #]
ㅇ 연속 확률변수의 기대값
[# E[X] = \int^{\infty}_{-\infty} x f_X(x) dx #]
※ [참고] ☞ 확률 모멘트 (1차 모멘트)
4. 확률변수 함수 g(X)의 기대값
ㅇ 단일 확률변수 함수의 기대값
- (이산) [# E[g(X)] = \sum_{x_i \in S_X} g(x_i)\;p_X(x_i) #]
- (연속) [# E[g(X)] = \int^{\infty}_{-\infty} g(x)\;f_X(x)\;dx #]
ㅇ 다변량 확률변수 함수의 기대값
- (이변량) [# E[g(X,Y)] = \int^{\infty}_{-\infty} \int^{\infty}_{-\infty}
g(x,y)\;f_{X,Y}(x,y)\;dxdy#]
- (다변량) [# E[g(X_1,\cdots,X_N)] = \int^{\infty}_{-\infty} \cdots \int^{\infty}_{-\infty}
g(x_1,\cdots,x_N)\;f_{X_1,\cdots,X_N}(x_1,\cdots,x_N)\;dx_1\cdots dx_N#]
5. 조건부 기대값 (Conditional Expected Value)
[# E[X|B] = \int^{\infty}_{-\infty} x\;f_X(x|B)\;dx #]
※ [참고] ☞ 조건부 확률의 의의 참조
6. 기대값 관련 성질
ㅇ 확률변수와 그 평균과의 차이의 기대값은, 영(0)이 됨
[# E[X-μ_X] = 0 #]
ㅇ 확률변수의 가중 합의 기대값은, 각 확률변수의 기대값을 가중한 합과 같음
[# E[aX+b] = aE[X]+E[b] = aE[X]+b #]
[# E\left[\sum^N_{i=1}a_iX_i\right] = \sum^N_{i=1} \int^{\infty}_{-\infty} \cdots
\int^{\infty}_{-\infty} a_ix_if_{X_i,\cdots,X_N}(x_1,\cdots,x_N)dx_1 \cdots dx_N
= \sum^N_{i=1}a_iE[X_i]#]
ㅇ 기대값과 분산과의 관계는,
[# Var[X] = E[X^2] - μ^2_X #]
- Var[·] : 분산, E[·] : 기대값, μ : 평균