1. [통계] 표본추출에 따른 오차
ㅇ 표본 오차 (Sampling Error / Random Sampling Error)
- 표본은, 모집단을 정확히 반영 못하고, 확률적인 오차를 수반하게 됨
. 모집단 전체가 아닌 일부 표본 추출된 값들 만으로 계산함으로 인해,
. 어쩔수없이/피할수없는/우연적으로 (by chance) 발생되는 오차
- 이에, 표본 오차는, 확률변수로 취급되며, 확률분포를 갖게됨
. 만일, 표본 오차의 확률분포를 알게되면,
. 어느 정도 크기의 오차가, 어느 정도의 확률로 나타나는지 알 수 있음
* 따라서, 평균에 대한 표본 오차({# μ - \bar{x} #})의 확률 분포는,
. (평균 : 0, 표준편차 : σ/√n)인 정규분포로 근사됨
. 한편, `σ/√n`를 `표준 오차` 라고 함
. 사실상, σ(표준편차)는, 모집단의 성질이므로, 미지의 (알수없는,추정되는) 숫자일 뿐임
- 때론, 표본 오차를, 추정 오차 (Estimation Error) 라고도 함
. 모집단 모수(미지의 참값)와 표본통계량으로 계산된 값(추정값) 사이의 불일치
.. 모집단 일부를 표본추출하고,
.. 이들 표본에 의해 모수를 통계적 추정 함으로 인해 발생되는 오차
. 표본 오차 = (모수의 참값 - 모수에 대한 추정값) = {# θ - \hat{θ} #}
* [참고]
. 사실상, 표본오차를 감소시킬 수 있는 유일한 방법은, 표본의 크기를 크게하는 것 뿐임
. 그러나, 현실적으로 표본 크기가 제한되므로,
. 따라서, 통계적 추론(통계적추정,가설검정 등)을 할 때는, 표본 분포의 확률을 고려하여,
. 적어도, 표본 오차(더 정확히 표준 오차) 보다는 크도록 해야 함
ㅇ 비 표본 오차 (Non-sampling Error)
- 표본의 선택,추출에서 자연적으로 발생하는 오차가 아니라,
- 표본의 성격을 잘못 관찰,측정,기록하여 발생되는 오차
. 측정오차 중 계통오차와 유사함