1. 통계 (Statistics, 統計)
ㅇ 데이터를 기반으로 하여, 불확실성에서도, 합리적인 의사결정을 돕는 도구 (방법론)
- 정량적이고 객관적인 평가 수행에 도움을 줌
ㅇ 데이터의 수집,요약,표현,분석,해석,판단 등을 다루는 수학의 한 분야
- 관심의 대상이 되는 집단(모집단)의 특성을 파악하기 위한 학문
. 모집단에서 추출한 표본으로부터,
. 미지의 모수를 추정,검정하는 과정을 통해,
. 전체 모집단의 특성을 유추
ㅇ (어원, 의미)
- 한자어 統計 : 모아서 계산한다
- 영어 statistics : 국가(state) 경영을 위해 필요한 인구,경제 자료의 수집과 활용 등
2. 통계학 분류
ㅇ 일반적인 분류
- 기술통계학 : 주로, 데이터의 축약
. 자료의 수집,정리,요약,분석을 통해 모집단 특성을 규명
.. 그래프 기법 例) 도표,챠트 등 설명 도구
.. 수치 기법 例) 평균,중앙값 등 특성량
- 추리통계학
. 표본으로부터 얻은 통계량을 기초로하여 모집단의 특성을 추론
.. 例) 가설검정, 통계적추정
- 분석통계학
. 합리적 의사결정을 위해 통계적 방법론(도구 사용 등)에 입각하여 분석
.. 분석 例) 상관분석,회귀분석,분산분석,다변량분석 등
ㅇ 모집단에 대해 어떤 가정을 하는지 여부에 따른 분류
- 모수 통계학 (Parameteric Statistics)
. 모집단 확률분포가 정규분포라든지 일정한/명시적인 가정을 함
.. 주로, 양적 자료(구간 자료,비율 자료) 만 취급
- 비 모수 통계학 (Nonparameteric Statistics)
. 모집단 확률분포에 대한 특별한 가정을 하지 않음
.. 주로, 질적 자료(명목 자료,서열 자료) 위주로 취급
. 주어진 데이터에 만 맞추어 통계적 모델을 구축하게 됨
* 여기서,
. 모수는, 모집단의 특성량인 평균,분산,표준편차,비율 등이나
. 비 모수는, 이러한 모수가 별 의미를 못갖는 경우를 일컬음
ㅇ 통계적 추론에 대한 사고 방식 차이에 따른 분류
- 전통 통계학 / 표준 통계학 / 네이만 피어슨 통계학
. 발생 빈도를 예측할 수 있는 경우에, 엄밀한 수학적 적용을 통해 추론
- 베이즈 통계학
. 경험에 따른 주관적 견해를 확률로써 추론에 이용
3. 통계학 역사
ㅇ 1654년 파스칼, 페르마 : 확률에 수학 이론 도입 (확률론의 시초)
ㅇ 1712년 드무아브르(de Moivre) : 포아송 근사
ㅇ 1713년 베르누이 : 대수의 법칙
ㅇ 1733년 드무아브르 : 이항분포의 정규분포 근사
ㅇ ...
ㅇ 1805년 드장드르 : 최소제곱법
ㅇ ...
ㅇ 1810년 라플라스 : 중심극한정리
ㅇ ..,
ㅇ 1900년 칼 피어슨 : χ²검정
ㅇ 1908년 고셋 : 스튜던트 t검정 (소 표본 이론)
ㅇ ...
ㅇ 1918년 피셔 : 분산분석
ㅇ ...
ㅇ 1937년 네이만 : 신뢰구간 개발
ㅇ ...
※ 시대 구분
- 1650 ~ 1750년대 : 확률의 시대
- 1750 ~ 1820년대 : 오차 이론의 시대
- 1820 ~ 1880년대 : 통계의 시대
- 1880년대 이후 : 통계학의 시대 (통계적 추론,분석 등)
※ 확률론과 통계학을 연결 발전시킨 주요 인물들
- 칼 피어슨(1857~1936), 로널드 에일머 피셔(1890~1962), 고셋(1876~1937),
예르지 네이만(1894~1981), 이건 피어슨(1895~1980) 등
4. [참고사항]
ㅇ 통계학의 대상이되는 데이터 종류 및 그 표현 ☞ 자료 분류/데이터 분류 참조
- 범주형 (명목척도,서열척도), 수치형 (등간척도,비율척도)
ㅇ 통계 자료의 정리/표현 도구 ☞ 통계 자료 표현 참조
ㅇ 통계적 특성을 수치화/변수화/대표화한 량(量) ☞ 통계량 참조