1. t 분포 (t Distribution)
ㅇ 정규분포의 평균의 해석에 많이 쓰이는 분포
- 주로, 모집단이 정규분포라는 정도 만 알고, 모 표준편차는 모를 때,
- 소 표본(n<30)으로도, 모 평균을 추정하려고,
- 정규분포 대신에 사용되는 확률분포
※ t 분포는 아일랜드 통계 학자 William Sealey Gosset(1876~1937)에 의해 발견
- 표본 수가 작은 표본 평균이 어떤 분포를 따르는지 관심을 갖음
- Student라는 가명으로 1908년 논문을 발표 (Student t-분포 라고도 함)
- 후에, 피셔(R.A.Fisher)가 t 분포 이론을 일반화시켜 정립함
2. t 분포의 용도
ㅇ 모집단에서 추출한 표본통계량(표본평균)의 분포를 설명하는 데 널리 사용 ☞ 표본 분포 참조
ㅇ 모 평균을 표본 평균으로 추정,검정할 때 등 ☞ t 검정 참조
- 특히, 표본 크기가 작거나 모 분산(모 표준편차)을 모를 때,
- 모 평균을 추정하려고, 표본 표준편차를 대신 사용하려 할 때 유용
- 즉, 정규분포를 기반으로 하지만, 모 표준편차를 모를 때, 주로 사용되는 확률분포 임
3. t 분포의 표기 및 형태
ㅇ 표기 : T ~ t(r)
- 여기서, r 은 양의 상수로써, 자유도 (= 표본의 수 - 1) 임
. t 분포는 단일한 분포라기 보다는,
. 자유도라는 모수에 따라 t₁,t₂,.... 등 무수히 많은 분포 군이 있음
ㅇ 형태
- 자유도가,
. 30 이하이면, 표준정규분포 보다 분산이 커져 보다 평평한 모양이 되고,
. 30 이 넘으면, 표준정규분포와 비슷하게 되고,
. 120 이상이 되면, 표준정규분포와 완전히 같아짐
4. t 분포의 모양(형태)
ㅇ 표준정규분포(Z 분포)와 유사하게, 0 을 중심으로 좌우대칭 이나,
- 표준정규분포 보다 평평하고 기다란 꼬리를 갖음 (양쪽 꼬리가 두터운 형태)
- 즉, 표준정규분포 보다 분산이 크므로, 보다 평평한 모양을 갖음
ㅇ 자유도에 따라 다른 모양을 나타냄 (한편, χ² 분포 도 이와 유사함)
- 자유도(= 표본의 수 - 1)가 증가할수록, 표준정규분포에 가까워짐
. 대개, 자유도가 30 이 넘으면, 표준정규분포와 비슷하게 됨
- 자유도가 작아지면, 표준정규분포에 비해 완만해지고 가로폭이 확산됨 (꼬리가 두꺼워짐)
5. t 분포의 확률변수의 변환
ㅇ t 분포의 확률변수 : T
- T : 모 평균 μ의 추정에 사용되는 추정 통계량
. 표준정규분포의 표준화 변량인 Z 처럼, 표본평균({#\overline{X}#})을 ({#T_{\bar{X}}#})로 변환한 것
ㅇ 변환식
[# T = \frac{\overline{X}-μ}{s/\sqrt{n}} #]
- n : 표본 수, (n-1) : 자유도, {#\overline{X}#} : 표본 평균, μ : 모 평균, s : 표본 표준편차
※ 모분산을 모를 때, 불편성 표준오차로써의, 변환된 표본평균 {#T_{\bar{X}}#}는, t 분포를 따름
- 고셋이, 통계량 {#(\overline{X}-μ)/(s/\sqrt{n})#}이 정규분포가 아닌 t 분포임을 밝히고,
- 후에 피셔가 t 분포를 이론적으로 정리하였음
ㅇ 한편, 모집단이 정규분포라고 가정하고,
- t 분포 확률변수를 표준정규분포 또는 카이제곱분포로써 표현하면,
[# T = \frac{(\overline{X}-μ)/(σ/n)}{\sqrt{s^2/σ^2}}
= \frac{Z}{\sqrt{V/(n-1)}} = \frac{Z}{\sqrt{V/r}} #]
. r = (n-1) : 자유도 (= 표본크기 - 1)
. Z : 표준정규분포의 확률변수 {# Z = (\overline{X}-μ)/(σ/n) #}
. V : 자유도 r = (n-1) 인 카이제곱 분포의 확률변수 {# V = (n-1)s^2/σ^2 #}
6. t 분포의 확률적 특징
ㅇ t 분포의 확률밀도함수
ㅇ t 분포의 분산
- Var(T) = r/(r-2)
. 분산이 1 보다 큼
ㅇ t 분포의 평균
- E[T] = 0