1. F 통계량
ㅇ 모집단 분산이 서로 동일(σ12 = σ22)하다고 가정되는, 두 모집단으로부터,
- 독립적으로, 표본 크기가 각각 n1, n2으로, 2개의 표본을 추출하였을 때,
- 2개의 표본분산 s12, s22의 비율(s12/s22)을
- F 통계량 이라고 함
ㅇ (필요 조건)
- 두 모집단 모두 정규분포를 따름
ㅇ (응용)
- 통상, 모집단이 여럿일 경우에,
. 분산분석을 이용하여, 집단 간 변화량과 집단 내 변화량을 비교하기 위해,
. F 통계량이 취하는 F 분포에 의해 검정을 하게 됨
- 2 이상의 정규분포 모 집단의 모 분산의 비교 등
※ (명칭 유래)
- 통계학자 피셔(Ronlad Aylmer Fisher,1890~1962)의 이름 맨앞 F를 차용
2. F 분포
ㅇ F 통계량(s12/s22)을 확률변수로 취하는 표본분포를 F 분포라고 함
ㅇ F 분포의 표기
- F = s12/s22 ~ F(n1-1,n2-1)
ㅇ F 분포의 특징
- 분산의 비(比)에 관한 분포
. 분산의 비(比) : 2개의 표본분산 s12, s22의 비율(s12/s22)
- 분산의 비(比)에 관련된 검정에 자주 이용됨
3. F 검정
ㅇ 두 모분산 비율에 대한 가설 검정 (귀무가설 H0, 대립가설 H1)
- H0 : σ12/σ22 = 1
- H1 : σ12/σ22 ≠ 1
ㅇ 특히, 분산분석에서,
- 요인의 효과 유무를, 표본분산(s12,s22)의 대소로 판단하게 됨
ㅇ 그룹 간 편차 : 표본 분산 s12, 그룹 내 편차 : 표본 분산 s22 에서,
- s12이 더 크면, 요인 차이의 효과 있음 (유의성 있음)
- s22이 더 크면, 요인 차이의 효과 없음, 결과는 우연
ㅇ 결국, F 통계량 (s12/s22) 이,
- 1 보다 훨씬 크면, 집단 간 차이 있음 (요인 효과의 차이가 유의성 있음)
- 1 근처이면, 집단 간 차이가 없음 (단순 통계 오차 정도)