1. 이항 분포 (Binomial Distribution)
ㅇ 일련의 베르누이시행으로부터 생성되는 이산 확률분포
- 남/여, 성공/실패 처럼, 2개의 가능한 결과 만을 갖는 베르누이 시행에서,
- 이로부터 일련의 n번 시행으로 만들어지는 이산 확률분포
ㅇ 즉, 일련의 독립 시행으로부터, (성공률 p를 갖는 n번의 베르누이시행)
- n번의 시행에서, 성공(또는,실패)하는 횟수(x) 마다, (성공 횟수를 확률변수 X로 취함)
- 계산된 이산 확률 P(X=x)의 분포 (성공 횟수의 이산 확률 분포)
2. 이항 분포와 타 분포 간의 비교
ㅇ (베르누이시행과 관련된 여러 분포 비교)
- 베르누이분포 : X ~ B(1,p)
. (1번 베르누이 시행의 성공 확률분포)
- 이항분포 : X ~ B(n,p)
. (n번 베르누이 시행의 성공 횟수 확률분포, n=1일 때 베르누이분포와 같아짐)
- 기하분포 : X ~ Geo(p)
. (처음 성공할 때까지의 베르누이 시행 횟수 분포)
- 음이항분포(파스칼분포) : X ~ NB(k,p)
. (k번째 성공할 때까지의 베르누이 시행 횟수 분포)
ㅇ 한편, 다항 분포는,
- 시행 결과가 단지 2개가 아닌, 여러 개 중의 하나인 다항 시행(Multinomial)에 대한 확률분포 임
3. 이항 분포의 모양
ㅇ 성공 확률(p)에 따른 분포 모양
- 성공 확률이, p = 0.5 일 때, 대칭적인 종 모양 (Bell Shape)
. 기대값이 n/2 이고, 분포 중심이 이 값에 위치하게 됨
- 성공 확률이, p < 0.5 일 때, 왼쪽으로 치우침 (left-skewed)
. 왼쪽이 더 길어지고 오른쪽이 짧아짐
- 성공 확률이, p > 0.5 일 때, 오른쪽으로 치우침 (right-skewed)
. 오른쪽이 더 길어지고 왼쪽이 짧아집니다.
ㅇ 시행 횟수(n)에 따른 분포 모양
- 작은 n 일 때, 특정 값 주위에 모임
. 상대적으로 뾰족할 수 있으며, 때로는 특정 값에 집중된 막대 모양일 수도 있음
- 큰 n 일 때, 부드러워짐
. 특히, p = 0.5에 가까울수록, 종 모양으로 변하며,
. 매우 큰 n 일 때, 기대치를 중심으로 좌우 대칭하는 정규분포에 근사하게 됨
※ [그림참조] ☞ 티스토리 (수학끄적 : 이항분포)
4. 이항분포 표기
ㅇ 표기 : X ~ B(n,p)
- 모수가 n,p인 이항분포
. n : 베르누이 시행 횟수, p : 성공율(성공 확률)
. X : 확률변수 (성공율 p인 베르누이 시행을 n번 반복할 때 성공횟수)
5. 이항분포 특징
ㅇ 확률질량함수
[# P(X=x) = \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p)^{n-x}
= {_nC_x} \; p^x (1-p)^{n-x} \quad\quad (0 \leq x \leq n) #]
- n : 시행 횟수, x : 성공 횟수, p : 성공 확률, (1-p) : 실패 확률
- [# \begin{pmatrix} n \\ x \end{pmatrix} = {_nC_k} #]
: 이항계수
[# \begin{pmatrix} n \\ k \end{pmatrix} = C(n,k) = {_nC_k} = \frac{P(n,k)}{P(k,k)}
= \frac{n!}{(n-k)!k!} = \frac{n(n-1)\cdots(n-k+1)}{k!} #]
※ (특별한 경우)
- 성공 확률이 극히 작을 때 (p << 1)
[# P(X=x) \approx \begin{pmatrix} n \\ x \end{pmatrix} p^n #]
- 시행 횟수 n이 매우 클 때
. 확률분포 모양이 기대치를 중심으로 좌우 대칭하는 정규분포로 접근 함
- 시행 횟수 n이 1 일 때,
. 베르누이분포 B(1,p)와 같아짐
ㅇ 기대값 : np
[# E[X] = E[X_1+X_2+\cdots+X_n] = E[X_1]+E[X_2]+\cdots+E[X_n] \\
\qquad\; = p+p+\cdots+p = np #]
ㅇ 분산 : np(1-p)
6. 이항분포 例)
ㅇ 이항분포 유형 例)
ㅇ 이항분포 문제 例 1)
- 표본공간 S = {0,1}, 3번 시행에서, 1번 실패(0),2번 성공(1)하는 사건의 확률은?
. 관측 가능 수열 :
. 경우의 수(시행 횟수) : 3개 (n)
. 성공 회수 : 2회 (x)
. 이항계수 :
. 성공확률 : p = 1/2, 실패확률 : (1-p) = 1/2
. 이항분포 : X(x=2) ~ B(n=3,p=1/2)
. 따라서,
ㅇ 이항분포 문제 例 2) : 디지털 통신에서, 수신 비트 오류 발생 수에 대한 확률은?
- 길이 n 비트열을 비트 오류 확률 p 인 채널을 통해 전송할 때,
- 수신된 n 비트열(부호어) 내에, 1개 이상(1≤k≤n)의 비트 오류가 발생할 확률은,
[# P_E = \sum^n_{k=1} \begin{pmatrix} n \\ k \end{pmatrix} (1-p)^{n-k} p^k #]