1. 상관 및 상관 분석 이란?
ㅇ 상관성 (Correlation)
- 두 변량 간의 함께 변하는 경향 (상호 관련성)
* 단, 상관관계는 인과관계를 전제하지 않음
ㅇ 상관 분석 (Correlation Analysis)
- 두 변량 간의 선형적 관계의 유무, 강도(크기), 방향성 등을 정량적으로 분석하는 통계적 분석
. 주로, 상관계수를 통해 두 변수 간의 관계를 수치화함
- 분석 대상 : 관계의 존재 여부 파악, 관계의 방향(양/음), 관계의 강도(밀접도)
2. 상관분석, 회귀분석 간의 비교
ㅇ 상관분석 : 두 변량 상호 간에 서로 영향을 미치는지 상관관계의 `유무`,`크기`,`방향성` 분석
- 결과 지표 : 상관계수 (r), 공분산 (Cov)
- 분석 관점 : 상호 관계성 중심, 선형적 관계
- 해석 방향 : 관계의 방향 및 정도만 설명
* 상관은, 상관관계 만을 따지며, 인과관계를 전제로 하지 않음
ㅇ 회귀분석 : 두 변량 간에 확률적 함수 관계의 탐구, 한 변량에 의한 다른 변량의 변화 `예측` 분석
- 결과 지표 : 회귀식(y = a + bx), 결정계수(R²)
- 분석 관점 : 인과 관계성 중심, 확률적 함수 관계(모델식),
- 해석 방향 : 독립변수(X)에 따른 종속변수(Y)의 변화 설명 및 예측
* 회귀는, 두 변량을 요인과 결과로 구분하고, 인과관계를 분석하게 됨
3. 변량 간 상관관계 분석 및 표현
ㅇ 상관관계의 도형적 표현 ☞ 산점도
- 두 변수 간의 관계 방향(양/음)과 패턴(선형/비선형)을 시각적으로 확인
ㅇ 상관관계를 내포하는 확률들
- 결합확률 : 두 확률변수가 동시에 특정 값을 가질 확률
- 조건부확률 : 한 변수가 주어졌을 때, 다른 변수가 특정 값을 가질 확률
- 주변확률 : 한 변수를 단독으로 고려할 때의 확률
ㅇ 상관관계의 크기 척도 및 방향성
- 확률 변수 간 상관성 평가 척도 ☞ 공분산, 상관계수
. 공분산 : 두 변수의 함께 변동하는 정도
.. Cov(X, Y) = E[(X − μₓ)(Y − μᵧ)]
. 상관계수 : 공분산을 두 변수의 표준편차로 표준화한 척도
.. r = Cov(X, Y) / (σₓσᵧ) (−1 ≤ r ≤ +1)
- 상관관계의 방향성
. 양의 상관관계 : 두 변량이 같은 방향으로 움직임 (공분산,상관계수가 양(+) 임)
.. r > 0 : 양(+)의 상관 → X, Y가 같은 방향으로 증가
. 음의 상관관계 : 두 변량이 반대 방향으로 움직임 (공분산,상관계수가 음(-) 임)
.. r < 0 : 음(−)의 상관 → X, Y가 반대 방향으로 변화
. 낮은 상관관계 : 두 변량이 선형독립 (공분산,상관계수가 영(0)에 가까움)
.. r ≈ 0 : 거의 관계 없음
ㅇ 신호 및 시계열에서의 상관성 척도 ☞ 상관함수
- 자기상관 함수 : 신호 자기 내 유사도 평가
- 상호상관 함수 : 두 신호 간 유사도 평가
ㅇ 다중 변량의 상관분석 확장
- 다중 상관계수 (Multiple Correlation Coefficient)
. 한 종속변수와 여러 독립변수 간의 상관 정도
- 편 상관계수 (Partial Correlation Coefficient)
. 다른 변수들의 영향을 통제한 상태에서의 두 변수 간 순수 상관
- 정준 상관계수 (Canonical Correlation Coefficient)
. 두 개의 변수 집합 간 상관관계의 최대값을 추출하는 분석