1. 산포 / 변동성 / 분산도 (散布 : Variability, 때론 Variation, Dispersion)
ㅇ (의미)
- 관찰된 자료들이 중심 위치에서 얼마나 넓게 퍼져있는 (흩어진) 정도를 말하거나,
- 또는, 불확실하고 변동폭이 크며 랜덤성이 강한 경향 등을 일컬음
ㅇ (핵심)
- 외부의 준거/기준을 모두 배제하고,
- 오로지 자료 내부의 변동에 만 촛점을 맞춤
2. 자료 내부 변동성(Variability)의 수량화 요약
ㅇ 차이 (Difference) : 두 수 간의 차이
ㅇ 편차 (Deviation) : 관측값과 평균값과의 차이
ㅇ 변동 (Variation) : 제곱 편차의 합 (편차 제곱 합)
ㅇ 분산 (Variance) : 변동을 평균화시킨 개념
ㅇ 변동계수 (Coefficient of Variation) : 평균 1 단위 당 표준편차의 크기
ㅇ 절대 편차 (Absolute Deviation) : 편차의 절대값
ㅇ 평균 절대 편차 (Mean Absolute Deviation) : 절대 편차의 평균값
ㅇ 제곱 편차 (Square Deviation) : 편차의 제곱값
ㅇ 제곱 편차의 합 (Sum of Squres of Deviation) : 제곱 편차들을 합한 값 => 변동(Variation)
ㅇ 평균 제곱 편차 (Mean Square Deviation) : 제곱 편차를 평균화한 값 => 분산(Variance)
ㅇ 평균 제곱 편차의 제곱근 : 평균 제곱 편차를 제곱근한 값 => 표준 편차(Standard Deviation)
- 즉, 분산의 제곱근
3. 차이 (Difference)
ㅇ 두 수 간의 차이값
ㅇ 차이 및 편차 비교
- 차이(Difference) : 단지, 두 개별값 간의 크기 차이
- 편차(Deviation) : 개별값과 평균값 간의 차이
4. 편차 (Deviation)
ㅇ 변수의 개별 값({#X_i#})과 그 평균 값({#\overline{X}#} or {#μ#})과의 차이
[# X_i - \overline{X} #]
또는 [# X_i - μ #]
ㅇ 편차 = (개별값) - (평균값)
- 각 데이터의 평균과의 차이
ㅇ 편차의 성질
- 편차는 부호(+,-)를 가짐
- 모든 편차를 합하면 0 이 됨
[# \sum (X_i-\overline{X}) = \sum X_i - n \overline{X}
= \sum X_i - n \frac{\sum X_i}{n} = 0 #]
5. 변동 (Variation) : 변동성의 척도
ㅇ 편차의 제곱의 합 (Sum of Squres of Deviation, SS) : (편차 제곱 합)
- 즉, 변동 = (편차 제곱 합) = (편차 1)2 + (편차 2)2 + ...
[# SS = \sum (X_i - \overline{X})^2 #]
또는 [# SS = \sum (X_i - μ)^2 #]
6. 분산 (Variance) σ2 또는 s2 : 변동성을 평균화한 개념
ㅇ 변동(편차 제곱 합)을 데이터 수로 나눈 값
- 즉, 분산은, 변동성(Variability) 개념을 평균 개념으로 요약한 것임
ㅇ 분산 = (변동) / (데이터 수) = (편차 제곱 합) / (데이터 수)
[# σ^2 = \frac{SS}{N} = \frac{(X_1-\overline{X})^2 + (X_2-\overline{X})^2 + \cdots +
(X_n-\overline{X})^2}{N} #]
ㅇ 달리말하면, 변동을 자유도로 나누어서 이를 평균화한 것을 말함
7. 표준 편차 (Standard Deviation) σ : 변동성을 실효값화한 개념
ㅇ `편차의 제곱`에 `평균`을 취하고 이를 `제곱근`한 값
- 달리말하면, 편차의 실효값(rms,제곱 평균 제곱근) 이라고도 볼 수 있음
- 분산에 대해서는, 양(量)의 제곱근을 취한 값 (분산의 제곱근)
ㅇ 표준편차 = (편차의 실효값) = (분산)1/2
8. 변동 계수 (Coefficient of Variation) CV : 자료집단 간 변동성 비교
ㅇ 서로 다른 자료 집단들 간에 (특히, 평균 크기가 현저하게 다른 경우에),
- 변동성(Variability, 흩어짐 정도)을 비교코자 한 척도
ㅇ 변동계수 = (표준편차) / (평균)
- 즉, 평균 1 단위 당 표준편차의 크기로써,
. (모집단) [#CV = \frac{σ}{μ}#]
. (표본) [#CV = \frac{s}{\overline{X}}#]
- 서로다른 집단들 간에, 상대적 변동성의 척도 (서로간에 흩어짐 정도의 비교)로 삼을 수 있음