1. 초기하 확률분포
ㅇ 모집단에서 비복원추출을 통해, 표본을 채취하는 베르누이 시행에 대한, 이산형 확률분포
ㅇ 이항분포와 다른점
- 매 시행이 서로 통계적 독립인(서로 영향을 주지않는) 이항분포와는 달리,
- 앞의 시행이 다음 시행에 영향을 주는 경우의 확률적 모형
2. 초기하 확률분포 특징
ㅇ 초기하 분포의 표기 : X ~ HGe(N,M,n)
- N : 유한 모집단 크기
- M : 관심있는 사건의 개수 (M < N)
- N - M : 관심없는 사건의 개수
- n : 표본 크기 (n < N)
- X : 확률변수 (표본 n 내에서 관심있는 사건의 개수, x = 0,1,2,...,n)
ㅇ 확률질량함수
[# P(X=x) = \frac{{_MC_x} \cdot {_{N-M}C_{n-x}}}{{_NC_n}} #]
- (분모) 전체 N개 중 동시에 n개를 표본 추출 (비복원추출) : {#{_NC_n}#}
- (분자) 결합사상으로, 다음 두 경우를 곱함
. 관심있는 M개 중 x개 경우의 수 : {#{_MC_x}#}
. 관심없는 N-M개 중 n-x개 경우의 수 : {#_{N-M}C_{n-x}#}
ㅇ 평균
[# E[X] = nM/N #]
ㅇ 분산
[# Var[X] = \frac{nM}{N} \left( 1 - \frac{M}{N} \right) \left( \frac{N-n}{N-1} \right) #]
3. 이항분포, 다항분포, 초기하분포 비교
ㅇ 例) [통계적품질관리]
- 불량률 p, 로트 크기 N 에서, 표본 크기 n 으로 샘플링할 때에, 불량개수 X의 확률분포는?
. 복원추출 : 이항분포를 따름
. 비복원추출 : 초기하분포를 따름