Normal Distribution, Gaussian Distribution   정규 분포, 가우시안 분포, 가우스 분포, 가우시안 확률분포

(2023-11-08)

가우시안, Gaussian Function, 가우스 함수, 가우시안 함수, Gaussian Probability Density Function, 가우시안 확률밀도함수, 가우스 확률밀도함수


1. 정규(Normal) 또는 가우시안(Gaussian) 이란?

  ㅇ 자연 현상을 묘사할 때, 다음과 같이, 종(鐘,bell) 모양의 함수 형태를 띄면,
     - 이를 `가우시안`이라고 칭함

  ㅇ 가우스 함수(Gaussian Function) 또는 정규 함수(Normal Function)
       
[# f(x) = \frac{1}{\sqrt{2π}} e^{-\frac{x^2}{2}} #]
- 한편, 표준정규분포(μ = 0,σ = 1)에서는, 이 함수 자체가 확률밀도함수 그 자체임 ㅇ 정규 분포 또는 가우시안 분포 - 자연과학,사회과학의 통계적 방법에서 가장 많이 이용되는 대표적 확률분포 . 잡음,측정 오차들의 분포 등 많은 자연현상을 매우 잘 표현하는 이상적인 확률모형 . 일상적인 키,몸무게,제품수명 등 대부분의 자료분포가 정규분포에 매우 근사적 접근 . `자연 질서의 표현` 이라고도 함 - 평균을 중심으로, 좌우대칭인 종(鐘,bell) 모양의 확률분포를 갖음 2. 정규분포의 역사, 명칭 ㅇ 역사 - 과거로부터 불확실성에 내재된 수학적 질서를 찾으려는 노력 있었음 - 프랑스 과학자 라플라스의 "확률에 대한 분석 이론 (1812)"에서, 중심극한정리 아이디어 제시 및 정규분포 원형 제시 - 독일 수학자,과학자 가우스가 물리학,천문학 등 다양한 영역에서 이를 활용 ㅇ 공학자는 `가우시안 분포`라고 하며, 수학자는 `정규 분포`라고 말함 - 1809년 독일수학자 가우스가 천체 위치의 측정 오차 분포를 이것으로 설명 ㅇ 기타 많은 수학자(통계학자)가, 종 모양(bell-shaped)의 거의 모든 분포가, - 가우스 분포를 보인다하여, 이것을 정규 분포(normal distribution)라고 부름 3. 정규분포의 모양, 형태 ㅇ 2개의 변수(`평균`,`분산`) 만으로 설명이 가능 - X ~ N(μ,σ²) . 곡선 모양이 분포 중심인 평균, 분포 폭인 분산(또는 표준편차 σ)에 의해 결정 ㅇ 확률밀도함수는 종형(bell-shape) 모양의 대칭적 분포를 가짐 - 평균값 μ을 중심으로 좌우대칭, 가운데에 위치한 값이 최대값 ㅇ 분산이 같으면 평균이 변하더라도 분포의 모양 자체는 변하지 않음 - 분산값이 클수록 굵고 평평한 종모양 형태이며, 작을수록 가늘고 뾰족한 형태 4. 정규분포의 확률 ㅇ (기대값 or 평균 ± n x 표준편차) 범위 내 면적이 그 만큼의 확률을 설명함 - 평균에서 ±3σ 범위 내 전체의 99.7% 가 존재 : {#P(μ-3σ<\overline{X}<μ+3σ)=0.9974#} - 평균에서 ±2σ 범위 내 전체의 95.5% 가 존재 : {#P(μ-2σ<\overline{X}<μ+2σ)=0.9544#} - 평균에서 ±1σ 범위 내 전체의 68.3% 가 존재 : {#P(μ-1σ<\overline{X}<μ+1σ)=0.6826#} ※ 특히, 다음의 경우들이, 통계학에서 많이 쓰이는 경우 임 ☞ 신뢰수준, 표준편차 참조 - 양측 1%점 (평균을 중심으로 99%가 존재) : {#P(μ-2.58σ<\overline{X}<μ+2.58σ)=99\%#} - 양측 5%점 (평균을 중심으로 95%가 존재) : {#P(μ-1.96σ<\overline{X}<μ+1.96σ)=95\%#} - 단측 상위 1%점 (좌끝단 ~ 오른쪽까지 99% 존재) : {#P(\overline{X}<μ+2.33σ)=99\%#} - 단측 상위 5%점 (좌끝단 ~ 오른쪽까지 95% 존재) : {#P(\overline{X}<μ+1.648σ)=95\%#} 5. 정규분포의 확률적 특징 ㅇ 표기 : X ~ N(μ,σ²) - 두 개의 모수 μ(평균),σ²(분산)에 의해 결정되는 확률적 분포확률밀도함수 (Probability Density Function, PDF)
[# f_X(x) = \frac{1}{σ\sqrt{2π}}\;e^{-\frac{(x-μ)^2}{2\,σ^2}} \quad\quad (-\infty < x < \infty) #]
- (X : 확률변수, μ : 평균, σ : 표준편차) 평균(기대값) : E[X] = μ ㅇ 분산 : Var[X] = σ² 6. [참고사항] ㅇ 정규분포의 정규화 ( 평균 μ= 0, 분산 σ2 = 1, N(0,1) ) - ☞ 표준 정규분포 (Q 함수, 오류함수) 참조 ㅇ 표본분포확률수렴중심극한의 정리 - 표본 크기가 커지면, 표본 평균확률분포(표본분포)는 정규분포에 수렴 . 정규분포를 갖는 독립적인 랜덤변수들의 합은 다시 정규분포를 띔 ㅇ 정규분포로부터 유도될 수 있는 확률분포들 - 카이제곱 분포, t 분포, 로그 노말 분포, Rayleigh 분포, Rician 분포 등 ㅇ 정규분포를 띄는 잡음 형태 ☞ 열잡음

정규분포
   1. 정규분포   2. 로그 정규분포   3. 이변량 정규분포  


Copyrightⓒ written by 차재복 (Cha Jae Bok)               기술용어해설 후원
"본 웹사이트 내 모든 저작물은 원출처를 밝히는 한 자유롭게 사용(상업화포함) 가능합니다"