1. 카이제곱 분포
ㅇ 표준정규분포와 관련이 있음
- 표준정규분포(Z)에서 취한 확률변수 Z의 제곱의 합 X가 따르는 확률분포
ㅇ 자유도에 따라 확률변수를 달리 취함
- 자유도 1에서, 확률변수 X = Z2가 카이제곱 분포를 따르게 됨
- 자유도 n으로 일반화하면, X = Z12 + Z22 + ... + Zn2
. (Z : 서로 독립인 표준정규화된 표준화 확률변수, n : 자유도)
ㅇ 활용 ☞ 카이제곱 검정 참조
- 표본 분산을 통한 모 분산에 대한 추론(검정,추정)
- 분포의 차이
- 범주형 자료의 분석 등에 많이 사용됨
2. 카이제곱 확률분포 형태
ㅇ 확률분포 모양이, 원점에서 양의 축 방향으로 늘어진 곡선을 갖는 형태를 띔
- 0 주변에 데이터가 집중되어 있음
ㅇ 자유도 n에 따라 분포의 형태가 다르게 결정되는, 비대칭적인 분포
- 자유도 n이 작을수록, 왼쪽으로 치우치는 비대칭 모양
- 자유도 n이 클수록, 정규분포에 근사됨
※ 1900년에 영국통계학자인 칼 피어슨에 의해 유도되었음
3. 카이제곱 분포 표기 및 타 분포와의 관계
ㅇ 표기 : X ~ χ2(n)
- 모수 n(자유도)에 따라 달라지는 분포곡선군을 갖음
. t 분포 처럼 자유도 n라는 한 개의 모수를 갖음
ㅇ 한편,
- Y = X1 + X2 ~ χ2(n1 + n2)
ㅇ 감마분포에서 α= n/2, β= 2 인 특별한 경우 임
- X ~ Gam(α,β) ↔ Y = 2X/β ~ χ2(2α)
4. 카이제곱 분포 특징
ㅇ 확률밀도함수
- 확률값 표현
ㅇ 기대값 : E[X] = n
ㅇ 분산 : Var[X] = 2n
ㅇ 적률
ㅇ 적률생성함수