1. 구간 추정 (Interval Estimation)
ㅇ 표본으로부터,
- 미리 정해진 확신(또는,`신뢰 수준`)으로,
- 모수(참값)가 포함되리라고 여겨지는,
- `신뢰 구간`을 추정하는 통계적 추정 방법 (Confidence Interval Estimation)
* 여기서,
. 신뢰 수준 => 확률 값
. 신뢰 구간 => 모수 포함 기대(추정) 구간
2. 신뢰 수준 (Confidence Level) : 확률값 임 ☞ 신뢰 수준 의미 참조
ㅇ 미지의 모수가, 신뢰상한 ~ 신뢰하한 사이 (신뢰구간 내)에 있으리라고 확신하는 확률
- 즉, 모수(참값)가 추정한 구간 내 포함되리라고 확신하는/신뢰할 수 있는 확률 수준 값
ㅇ 보통, 사용되는 신뢰수준 값 : 95%, 99% 등을 사용 (통상 95% 수준을 많이 사용하는 편)
- 이 수준값은 연구수행자가 직접 설정하게 됨
[# P(\hat{θ}_L \leq θ \leq \hat{θ}_U) = 95\% #]
ㅇ 한편, 오차율(오차범위)에 의한 신뢰수준 표현 : 1 - α 또는 (1-α)100%
[# P(\hat{θ}_L \leq θ \leq \hat{θ}_U) = 1 - α #]
- 1 - α : 1종 과오를 범하지 않을 확률 (신뢰 수준)
- α : 1종 과오를 범할 확률 (α 오차, 유의 수준, 위험률)
ㅇ (명칭) 신뢰수준 / 신뢰율 / 신뢰계수
- (Confidence Level / Degree of Confidence / Confidence Coefficient)
3. 모수의 포함에 대한 척도들 : 신뢰 수준, 신뢰 구간, 신뢰 한계, 신뢰 구간 길이
ㅇ 신뢰 수준 (Confidence Level)
- 신뢰 구간 내 모수가 포함되리라고 확신하는 확률값
ㅇ 신뢰 구간 (Confidence Interval)
- 일정한 신뢰 수준으로, 모수가 포함되리라고 기대되는 구간 : {#[\hat{θ}_L,\hat{θ}_U]#}
ㅇ 신뢰 한계 (Confidence Limits) : {#\hat{θ}_L#}, {#\hat{θ}_U#}
- 신뢰 하한(Lower Confidence Limit) : {#\hat{θ}_L#}
- 신뢰 상한(Upper Confidence Limit) : {#\hat{θ}_U#}
ㅇ 신뢰 구간 길이 (Confidence Interval Length) : {#\hat{θ}_U - \hat{θ}_L#}
- 신뢰 구간의 길이(폭)는 짧을수록 좋음
. 모수의 위치 정보를 더 정확하게 알려줌
- 결국, 오차의 크기(확률값으로는 오차율)를 나타냄
4. 모수의 벗어남에 대한 척도들 : 오차율, 오차의 한계
ㅇ 오차율 (probability of error) : α
- 모수(참값)가 신뢰 구간에 포함되지 않을 확률 (1종 과오를 범할 확률)
. 보통 0.1%, 0.05%, 0.01% 등을 사용 (통상 0.05% 를 많이 사용하는 편)
* 오차율을, 가설검정에서는 유의수준 이라고 함
ㅇ 오차의 한계 (margin of error)
- 신뢰구간의 길이({#\hat{θ}_U - \hat{θ}_L#})를 결정짓는 값
. 모 분산 또는 모 표준편차를 알고 있을 때 : [# Z_{α/2} \frac{σ}{\sqrt{n}}#]
5. 신뢰 구간의 추정 例)
ㅇ 개요
- 모집단이 정규분포를 따르고, 모 분산 σ2(모 표준편차 σ)를 알고있음
- 95% 신뢰수준에서,
- 추출된 표본의 표본 평균에 의해 모 평균의 신뢰구간을 계산하려고 함
ㅇ 계산식
[# P\left(μ - 1.96\frac{σ}{\sqrt{n}} ≤ \bar{X} ≤ μ + 1.96\frac{σ}{\sqrt{n}}\right)
= 95\% #]
- {#μ#} : 모 평균
- {#σ#} : 모 표준편차
- {#σ/\sqrt{n}#} : 표본오차
- {#n#} : 표본 크기
- {#\bar{X}#} : 표본평균
ㅇ 즉, 95% 신뢰수준 하에, n개 표본으로 볼 때,
- 표본 평균이 모수(모 평균)를 포함하는 기대 구간은?
[# μ - 1.96\frac{σ}{\sqrt{n}} ≤ \bar{X} ≤ μ + 1.96\frac{σ}{\sqrt{n}} \\
-1.96 \le \frac{\bar{X}-μ}{σ/\sqrt{n}} \le +1.96 #]
* 결국, 관측 데이터(표본 크기 n)가 많을수록, 모수 포함 기대 구간은 좁아짐
6. [추가 검토사항]
ㅇ 신뢰구간 {#[\hat{θ}_L,\hat{θ}_U]#}을 얻는 방법 ☞ 신뢰구간 설정 참조
- 모 평균의 신뢰구간, 모 분산의 신뢰구간, 모 비율의 신뢰구간
ㅇ 표본 크기의 결정 : 검출력 (Power of Test)