1. 독립성 검정 (Test of Independence)
ㅇ 항목 간의 `상호 관계가 우연인가 필연인가 (상호 독립성 여부)`를 판단하는 검정 유형
ㅇ 주로, 질적 자료의 크로스 집계표 상의 행,열 간에 독립성(관련성)을 따질 때,
- 카이제곱 검정 (χ² 검정)을 활용
ㅇ 한편, 항목 간의 관계를 표로써 나타낸 표는, ☞ 분할표 참조
2. 카이제곱 검정 (χ² 검정)
ㅇ 대표적인 비모수 검정
- 카이제곱 검정은,
- 성별,혈액형,보수/진보 처럼 어떤 속성,범주에 따라 분류된 변수들이, ☞ 범주형자료 참조
- 서로 관련이 있는지 여부(변량 간에 독립성 유무)를 주로 검정하기 위한 가설검정
ㅇ 카이제곱 검정의 대상(특징)
- 적용 범위가 광범위하고, 응용기법도 다양함
- 사건(범주) 간의 인과관계가 독립인지 종속인지를 검정
. 例) 학력 수준과 선호하는 주거양식 간의 관계 등
- 원래 데이터가 없어도, 집계표(통계분할표) 만 있어도 검정이 가능
ㅇ 한편, 모집단의 분산에 대해 주로 사용하는 검정 방법들의 例로는,
- 단일 모집단의 분산에 대한 검정은, => χ² 검정
- 두 모집단 분산 간의 비율에 대한 검정은, => F 검정
3. 카이제곱 검정 시 가설 설정
ㅇ 귀무가설 : 변량(항목,범주) 간에 관계가 `독립적` 이라고 가정함
ㅇ 대립가설 : 변량(항목,범주) 간에 관계가 `의존적` 이라고 가정함
4. 카이제곱 검정의 검정 통계량
ㅇ 카이제곱 검정 통계량 또는 피어슨 통계량 (χ²)
[# χ^2 = \sum^k_{i=1} \frac{(o_i - e_i)^2}{e_i} #]
- k : 범주의 수, (k-1)의 자유도
- o : 범주 i의 실제 관측치
- e : 귀무가설이 옳다는 전제하에 기대되는 범주 i의 기대 빈도수
ㅇ 위 식으로 정의된 표본 통계량의 확률분포가 카이제곱 분포를 따름