1. 표준 정규분포 (Standard Normal Distribution)
ㅇ 정규분포를 규격화시킨 것
- 다양한 종(Bell) 모양의 정규분포를,
- 평균 μ이 0 이고 표준편차 σ가 1 로 규격화시킨 것
2. 표준 정규분포로의 변환 필요성
ㅇ 정규분포(가우시안 분포)의 불편함
- 평균 및 표준편차 값에 따라 중심 위치 및 전체 모양이 달라짐
. 2 이상의 정규분포를 서로 비교할 때 또는 확률값 계산할 때에 매우 불편
ㅇ 따라서, 모든 정규분포를 다음과 같이 표준적인 정규분포로 변환하여 사용이 바람직
- 즉, 평균이 0 이고, 표준편차가 1로 변환된 정규화된 분포 => 표준 정규분포
. 어떤 관찰값이 평균으로부터 표준편차의 몇 배 만큼 떨어져 있는가의 척도
ㅇ `표준 정규분포` 및 `정규분포` 공통점
- 평균을 중심으로 좌우대칭이고 종 모양을 하는 점이 똑같으며,
- 또한, 전체 면적이 1 이고, 각 σ 만큼의 면적이 변환 전후에도 같음
3. 확률변수의 표준화 (Standardized Random Variable)
ㅇ 정규분포의 확률변수 X를 변환시켜, 평균 μ= 0, 분산 σ2= 1 이 되도록 표준화시킨 확률변수
- 이러한 표준화/정규화 변환을 `Z 변환`이라고도 함 ☞ 표준화 변량, z 값 참조
ㅇ 즉, 변량 또는 확률변수 X의 표준화(정규화)된 Z 변환은,
- Z = (X - μ)/σ
. Z : 표준화된 변량 (표준 정규 확률변수)
. X : 변량, μ : 기대값 또는 평균, σ : 표준편차
ㅇ 역으로, 일반 정규분포의 데이터 값은,
- X = Zσ + μ
4. 표준 정규분포의 확률값 구하기
※ 면적 계산 => 대부분의 통계책 부록에 있는 `표준 정규분포표(Z table)`을 이용
- 표준 정규분포표(Z-table) : 특정 Z 값에서의 면적 수치를 표로 보여줌
ㅇ `(평균) 0 ± n x (표준편차) 1` 범위 내 면적으로써 그 만큼의 확률값을 설명함
- 평균 0에서 ±3 범위 내 전체의 99.74% 가 존재 : P(- 3 < X̅ < + 3) = 0.9974
- 평균 0에서 ±2 범위 내 전체의 95.44% 가 존재 : P(- 2 < X̅ < + 2) = 0.9544
. 일반 정규분포의 확률변수로 나타낼 때는, -1.96 ≤ (X - μ)/σ ≤ +1.96
- 평균 0에서 ±1 범위 내 전체의 68.26% 가 존재 : P(- 1 < X̅ < + 1) = 0.6826
5. 표준 정규분포의 확률적 특성
ㅇ X ~ N(0,1)
- 평균이 0 이며, 분산이 1 로써 표준화된 정규분포
ㅇ 확률밀도함수 (PDF)
ㅇ 누적분포함수 (CDF)
※ 위 확률함수는 해석적이 아닌 수치적으로 구해짐
- 다음과 같이 Q 함수를 정의하여, 수치적으로 계산해 놓은 표를 찾아서 이용함
6. 일반 정규분포 특성
ㅇ 일반 정규분포의 확률밀도함수(PDF)
ㅇ 일반 정규분포의 누적분포함수(CDF)
ㅇ 일반 정규분포의 확률값