1. 확률 모델 / 확률 모형 (Probability Model)
ㅇ 랜덤한 또는 확률적 현상에 대한 수학적 모형화
- 추측통계학의 기초임
ㅇ 확률적으로 모델을 세우는 이유
- 불확실한/확률적 상황에 대해, 통계적(수학적) 모형을 세우고,
- 정량적으로 예측을 해보며,
- 예측 기대와의 일치 정도를 합리적으로 평가하기 위함
ㅇ 확률 모델은, 단순히 불확실성을 다루는 도구일 뿐만 아니라,
- 과학적 데이터 분석, 기계 학습, 신호 처리 등 다양한 분야에 활용되는 근본적인 방법론임
※ [참고]
- 확률 계산을 위한 수학적 규칙의 근거는, ☞ 확률 공리 참조
. 3 공리 (비음수성, 전체 확률 합은 1, 가산적 독립성)를 기반으로 확률 계산의 일관성 보장
- 확률 모델을 규정하는 특성치는, ☞ 모수, 통계량, 확률변수 참조
. 모수 : 관심의 대상이 되는 모집단의 대표값(참값)
. 통계량 : 단 하나의 수로 자료 집단을 대표하는 특성량
. 확률변수 : 특정 실험의 결과를 수치적으로 나타낸 것 (이산형과 연속형으로 구분)
2. 확률 모델의 수식화 및 가시화
ㅇ 확률 분포 (Probability Distribution)
- 통상, 가로축에 확률 변수의 값을, 세로축에 그 확률값(또는,확률 밀도)를 나타낸 분포
- 또한, 확률 모형 특성에 대한 전반적인 분포 정보를 가시화 제공
. 확률 변수가 취할 수 있는 각각의 모든 값들에 대하여 발생할 확률을,
. 수식,표,챠트,히스토그램,상자그림 등으로 표현 가능
ㅇ 확률 함수 (Probability Function) 또는 분포 함수(Distribution Function)
- 확률변수가 분포하는 형태를 함수적으로 보여줌
. 확률변수가 어떤 특정 실수를 취할 확률을, 함수로 나타낸 것
- 통상, 몇개의 모수를 포함한 수학적 (확률적) 함수 형태를 띔
. 모수(파라미터)를 알면, 분포 형태를 직감적으로 쉽게 알수 있게 됨
.. 例) 정규분포는 2가지 모수(μ : 분포 위치,σ : 분포 넓이)로 나타냄 : N(μ,σ)
.. 例) 표준정규분포는 2가지 확정된 모수(μ= 0,σ= 1)로 정해짐 : N(0,1)
* [참고] ☞ 확률질량함수(이산확률변수), 확률밀도함수(연속확률변수), 누적분포함수 참조
※ 이러한 수학적 틀을 사용하여,
- 확률 실험의 실현값들이, 확률적으로 어떻게 움직이는지(나타나는지) 이해할 수 있게 됨
3. 확률분포의 종류
ㅇ 이산적, 연속적
- 이산 확률분포 : 이산 확률변수가 나타내는 확률분포
. 例) 이산 균등분포, 베르누이분포, 이항분포, 초기하분포, 포아송분포 등
- 연속 확률분포 : 연속 확률변수가 나타내는 확률분포
. 例) 연속 균등분포, 정규분포, 지수분포, 와이블분포 등
ㅇ 일 차원(단일), 다 차원(다 변량)
- 일 차원 분포
- 다 차원 분포
. 결합 분포, 주변 분포, 조건부 분포
. 例) 다변수 정규분포 등
4. 확률분포의 활용
ㅇ 주요 통계량 계산 : 기대값 또는 평균, 분산, 첨도, 왜도 등
ㅇ 이들을 일원적으로 살필 수 있는 것 : 확률 모멘트
- 중심 모멘트 : 분포의 중심을 기준으로 한 변동성 측정
- 기타 모멘트 : 분포의 다양한 특성을 요약
5. [물리 (통계역학)]
ㅇ 미시적 입자의 속도의 확률분포 ☞ 맥스웰볼츠만속도분포 참조
ㅇ 미시적 입자의 통계학적 거동 ☞ 통계역학 참조
※ 통계역학 이란? : 미시적 입자의 거동을 통계적으로 분석해 거시적 물리량을 설명