1. 통계적 분석 이란?
ㅇ 합리적 의사결정을 위해,
- 통계적 방법론에 입각하여 분석을 실행하는데,
- 이에 필요한 각종 도구 및 방법들을 통계적 분석 도구 또는 통계적 분석 방법이라고 함
ㅇ 주로, 모집단의 성질을 파악하기 위함
ㅇ 한편, 이러한 학문분야를 분석 통계학이라고 함
2. 통계적인 분석 방법의 구분
ㅇ 일 변량 분석 : 단일 변량에 대한 분석 (Univariate Analysis)
- 단일 집단 분석
. 특정 모집단 평균의 추정과 검정 등
.. 모 평균에 대한 추론/추정 : 주로, 표준정규분포와 t 분포를 이용하여 이루어짐
.. t 분포를 이용한 검정을 t 검정 이라고 함
- 관측 집단/조건들 간의 분석
. 두 집단 간 평균의 차이를 비교/검정/분석 : t 검정 분석
.. 두 모집단 간 모 평균 차이에 대한, 통계적 유의성을 검증하는 방법
.. 두 모평균 어느 것도 알 수 없으므로, 두 표본 평균 차이의 확률분포를 따짐
ㅇ 다 변량 분석 : (다수 변량들 간의 `종속성` 분석)
- 상관 분석 (Correlation Analysis)
. 변량들 간에 어떤 선형적 관계(의존 유무, 그 관계의 강도 등)가 있는지를 밝히는 분석
. 두 변수가 연속형 변수일 때, 두 변수 간의 관계성을 분석
- 회귀 분석 (Regression Analysis)
. 상관분석의 일종이나, 어떤 변량이 다른 변량에 어떻게 영향을 주는지,
. 함수 관계(인과 관계)인 선형 회귀식을 도출하여 이의 모형을 세우고, 이를통해 예측/분석
- 분산 분석/변량 분석 (Analysis of Variance)
. 독립변수(요인,Factor) 차이에 따른 결과적인 종속변수와의 인과관계 효과 분석
. 모든 예측변수(독립변수)들이 질적인 경우(범주형 자료)의 분석 방법
.. 2 이상의 모집단 간의 평균을 비교하는 등
. 연속형 변수와 범주형 변수 간의 연관성을 분석하는데 많이 쓰임
- 판별 분석 (Discriminant Analysis)
. 데이터가 어느 집단에 속하는지를 판별할 수 있는 판별 함수를 찾아내는 분석 방법
- 구조방정식 모델 (Structural Equation Modeling, SEM)
. 다중 변수 간의 복잡한 인과관계를 모델링하는 데 사용
ㅇ 다 변량 분석 : (다수 변량들 간의 `상호의존성` 분석)
- 요인 분석, 인자 분석 (Factor Analysis)
. 잠재적인 요인을 찾음
.. 변수 배후의 공통 인자를 추출하여 변수 간의 관련성을 찾아냄
.. 여러 변수들 간의 관계를 분석하여, 숨겨진 패턴이나 주요 요인을 찾아냄
. 즉,
.. 관측 가능한 여러 변량들로부터, 공통되는 소수 잠재 요인들을 추출하여,
.. 이들 소수 잠재 요인을 통해, 변량 간의 관련성을 설명하는 분석
. 활용 例) 소비자 인식, 브랜드 이미지, 가치관 분석 등에 이용됨
- 주성분 분석 (Principal Component Analysis)
. 많은 변수들에 포함된 정보를, 새롭게 만든 더 적은 수의 변수로 나타낼 때 (종합 지표화 등)
- 군집 분석 (Cluster Analysis)
. 데이터들을 유사 집단으로 묶는 분석
ㅇ 다 변량 분석 : (외적 기준 유무)
- 외적 기준 없음 : 데이터 요약, 분류
- 외적 기준 있음 : 변량 예측, 새로운 데이터 그룹 판별(군집화) 등
※ 한편, 다 변수 분석과 다 변량 분석 의미상 차이점
* 통상, 동일 의미의 용어로 보나, 다음 처럼 달리 표현하기도 함
- 다 변수 분석 (Multivariable Analysis)
. 2 이상의 독립변수를 함께 관련지어 분석하는 통계적 분석 방법
.. 例) 다중 회귀분석 등
- 다 변량 분석 (Multivariate Analysis)
. 2 이상의 종속변수를 함께 관련지어 분석하는 통계적 분석 방법
3. [참고사항]
ㅇ 통계 자료의 종류 ☞ 자료 분류/데이터 분류 참조
ㅇ 통계 자료의 수치적 척도의 유형 ☞ 통계 척도 참조
ㅇ 통계 자료의 정리/표현 도구 ☞ 통계 자료 표현 참조
ㅇ 통계적 특성의 수치화/변수화한 량(量) ☞ 통계량 참조