1. `랜덤 변수` 또는 `확률 변수` 이란?
ㅇ 확률 실험에서 나올 수 있는 모든 결과를 대변(代辯)하는 변수임
- 표본공간(사건공간) 상의 표본(사건)에 숫자(실수값)를 부여하여 수량화한 것
ㅇ 표기
- 통상, X로 표기되며, 함수식으로 표현하면, x = X(확률실험결과) = X(ξ)
. (ξ: 확률실험결과 또는 사건, X: 확률변수, x: 실수값)
- 결국, 확률변수는,
. 표본 공간 상의 `표본 원소(元素)`와 `실수(實數) 값`을 이어줌
- 즉, ( Random Variable : Random Event ↔ Real Number )
2. `랜덤` 및 `변수`의 의미
ㅇ `랜덤(Random)` 이란?
- 랜덤변수 { x₁< X < x₂} 는 실험 시행 전에 표본공간 내 가능한 실험결과 중 임의값
. 실제 매 실험 마다 그 결과를 사전에 정확히 알 수는 없음
- 다만, 어떤 확률적 분포를 가질 수 있다는 통계적 규칙성은 있다고 봄
ㅇ `변수(Variable)` 이란?
- 랜덤(확률)변수가 어떤 값을 취하느냐가 `확률적으로 결정되는 변수`를 의미함
3. 확률 변수의 구분
ㅇ 이산 확률변수(Discrete Random Variable)
- 확률변수 값이 셀 수 있는 이산적임 (계수형)
. 例) 로트 내 불량수, 단위면적에 포함된 결점수 등 셀 수 있는 값을 취함
[# μ_X = \sum_x x P(x) \\
σ_X^2 = \sum_x (x-μ_X)^2 \, P(x) #]
* [참고] ☞ 이산확률분포 참조
. 이산 균등 분포, 베르누이 분포, 이항 분포, 다항 분포, 초기하 분포, 음이항 분포,
기하 분포, 포아송 분포 등
ㅇ 연속 확률변수(Continuous Random Variable)
- 확률변수 값이 연속적임 (계량형)
. 例) 제품의 중량, 직경 등과 같이 셀 수없는 연속적인 값을 취함
[# μ_X = \int^{\infty}_{-\infty} x f_X(x) \, dx \\
σ_X^2 = \int^{\infty}_{-\infty} (x-μ_X)^2 \, p_X(x) #]
* [참고] ☞ 연속확률분포 참조
. 연속 균등 분포, 지수 분포, 정규 분포, 감마 분포, 얼랑 분포, 와이블 분포,
레일리히 분포 등
4. 확률 변수의 확률적/통계적 구조 표현
ㅇ 분포 표현 ☞ 확률분포, 확률함수 참조
- 확률변수의 전반적 확률특성에 관한 완벽한 정보를 제공
. 분포 특성에 따라 이산형과 연속형으로 나뉘어짐
ㅇ 함수적 표현
- 확률변수의 확률적 분포 구조를 다음 3개에 의해 함수 처럼 기술 가능함
. 확률질량함수 (PMF)
. 확률밀도함수 (PDF)
. 누적분포함수 (CDF)
ㅇ 값 표현 : 확률변수의 통계적 성질을 값으로 나타냄 ☞ 통계량 참조
- 확률변수의 평균 또는 기대값 (μX,E[X]) : 확률분포의 중심위치
- 확률변수의 분산 (Var(X),σX2) : 확률분포의 산포 척도
- 확률변수의 모멘트 : 확률분포에 의해 일반화시킨 통계량
5. 확률 변수가 여럿일 때
ㅇ 관심 갖는 사항
- 단일 확률변수의 통계량 : 평균값,분산,모멘트 등 주로 확률분포의 중심,변동성을 따짐
- 다수 확률변수 간의 통계량 : 공분산,결합 모멘트 등 주로 확률변수 간의 관계성을 따짐
ㅇ 한편, 다루기 쉬운 例)
- 주로, 독립항등분포(iid, independent and identically distributed)일 경우를 다룸,
. 여러 확률변수들이 상호독립이며, 모두 동일한 확률분포를 갖는 것을 말함
- 특히, 서로 결합적이며, 서로다른 확률분포를 갖는 경우의 해석은 매우 복잡함
ㅇ 확률 변수의 변환 : 용도에 맞게 변환하는 문제
- 확률변수의 함수
. 확률변수 X의 함수 형태인 Y = g(X)의 확률분포를 구하는 문제
- 확률변수들의 합 ☞ 확률변수의 합 참조
. 확률변수들의 합(차)에 대한 기대값,분산,확률분포를 구하는 문제
- Y = aX + b
. E[Y] = E[aX + b] = aE[X] + b
. Var[Y] = Var[aX + b] = a2Var[X]
. σ[Y] = σ[aX + b] = |a|σ[X]
ㅇ 이변량 확률변수, 다중 확률변수 (확률 벡터) 이란?
- 동일 표본공간에서 2 이상의 확률변수를 함께 다루는 경우를 말함
ㅇ 다차원 다중 확률변수를 다룰 때 : 확률 행렬
- 각 열 또는 행이 확률 벡터가 되는 n x n 정방행렬
6. 확률 변수(랜덤 변수)가 시간과 관련될 때
※ ☞ 랜덤과정 참조
- 시간에 관련된 확률적인 성격을 갖는 계 (시간에 따라 확률특성도 랜덤함)
. 시간적 확률변수들의 집합 { X(t,ξ) } 을 고려함
1.
1.
2.
3.
1.
2.
3.
4.
5.
6.
7.
8.