1. 이항 분포 (Binomial Distribution)
ㅇ 일련의 베르누이시행으로부터 생성되는 확률분포
- 남/여 또는 성공/실패와 같이 2개의 가능한 결과 만을 갖는 확률변수(X)를 갖을 때,
- 이로부터 만들어지는 이산 확률분포
ㅇ 주요 용도
- 일련의 독립 시행(베르누이시행)에서 성공/실패할 횟수(x)에 대한 확률 계산 : P(X=x)
2. 타 분포와의 비교
ㅇ (베르누이시행과 관련된 여러 분포 비교)
- 베르누이분포 : X ~ B(1,p)
. (1번 베르누이 시행의 성공 확률분포)
- 이항분포 : X ~ B(n,p)
. (n번 베르누이 시행의 성공 확률분포, n=1일 때 베르누이분포와 같아짐)
- 기하분포 : X ~ Geo(p)
. (처음 성공할 때까지의 베르누이 시행 횟수 분포)
- 음이항분포(파스칼분포) : X ~ NB(k,p)
. (k번째 성공할 때까지의 베르누이 시행 횟수 분포)
ㅇ 한편, 다항 분포는,
- 시행 결과가 단지 2개가 아닌, 여러 개 중의 하나인 다항 시행(Multinomial)에 대한 확률분포 임
3. 이항분포 표기
ㅇ 표기 : X ~ B(n,p)
- 모수가 n,p인 이항분포
. n : 베르누이 시행 횟수, p : 성공율(성공 확률)
. X : 확률변수 (성공율 p인 베르누이 시행을 n번 반복할 때 성공횟수)
4. 이항분포 특징
ㅇ 확률질량함수
[# P(X=x) = \begin{pmatrix} n \\ x \end{pmatrix} p^x (1-p)^{n-x}
= {_nC_x} \; p^x (1-p)^{n-x} \quad\quad (0 \leq x \leq n) #]
- n : 시행 횟수, x : 성공 횟수, p : 성공 확률, (1-p) : 실패 확률
- [# \begin{pmatrix} n \\ x \end{pmatrix} = {_nC_k} #]
: 이항계수
[# \begin{pmatrix} n \\ k \end{pmatrix} = C(n,k) = {_nC_k} = \frac{P(n,k)}{P(k,k)}
= \frac{n!}{(n-k)!k!} = \frac{n(n-1)\cdots(n-k+1)}{k!} #]
※ (특별한 경우)
- 성공 확률이 극히 작을 때 (p << 1)
[# P(X=x) \approx \begin{pmatrix} n \\ x \end{pmatrix} p^n #]
- 시행 횟수 n이 매우 클 때
. 확률분포 모양이 기대치를 중심으로 좌우 대칭하는 정규분포로 접근 함
- 시행 횟수 n이 1 일 때,
. 베르누이분포 B(1,p)와 같아짐
ㅇ 기대값 : np
[# E[X] = E[X_1+X_2+\cdots+X_n] = E[X_1]+E[X_2]+\cdots+E[X_n] \\
\qquad\; = p+p+\cdots+p = np #]
ㅇ 분산 : np(1-p)
5. 이항분포 例)
ㅇ 이항분포 유형 例)
ㅇ 이항분포 문제 例)
- 표본공간 S = {0,1}인 3번 시행에서, 1번 실패(0),2번 성공(1)하는 사건의 확률은?
. 관측 가능 수열이
으로써,
. 경우의 수(시행 횟수)는 3개(n), 성공 회수 2회(x) :
. 성공확률 : p = 1/2, 실패확률 : (1-p) = 1/2
. 이항분포 : X(x=2) ~ B(n=3,p=1/2)
. 따라서,
ㅇ 디지털 통신에서 수신 비트 오류 발생 수 例)
- 길이 n 비트열을 비트 오류 확률 p 인 채널을 통해 전송할 때,
- 수신된 n 비트열(부호어) 내에 1개 이상(1≤k≤n)의 비트 오류가 발생할 확률은?
[# P_E = \sum^n_{k=1} \begin{pmatrix} n \\ k \end{pmatrix} (1-p)^{n-k} p^k #]