ANOVA   Analysis of Variance   분산 분석, 변량 분석

(2020-05-17)
1. 분산 분석 

  ㅇ 집단 간 비교 분석을 위한 통계 분석의 일종
     - 주로, 2 이상의 모집단에 대한 `비교 분석`,`차이 분석`을 함
     - 여기서,
        . 비교 분석 => 실험계획법에 의한 요인별 분석
        . 차이 분석 => 2 이상의 집단 간 모 평균의 차이분석

  ㅇ 집단 간의 분산기본 단위로 삼아 집단 간의 차이를 규명함
     - 표본 분산들을 분석해 봄으로써, 모집단 간의 평균들에 대해 동질성을 검정하는, 통계적 분석 
        . 서로다른 모집단인가 아니면 실제로는 단일 모집단인가를 판별하는 것


2. 분산 분석의 특징

  ㅇ 2 이상의 여러 모집단 간에, 실험으로 효과를 확인하는 통계적 분석 방법
     - 실험 요인이 결과 효과에 영향을 미쳤는지 확인 함
        . 실험 결과 데이터가 `우연인가` 또는 `우연이 아닌가` 그 효과 여부를, 판별/검정 함
     - 주로, 이들 모 평균 간에 차이가 있는지를 동시에 검정할 필요가 있을 때에 활용
     - 즉, 두 실험집단의 표본 평균의 차이에 대한 유의성 검정

  ㅇ 주로, 질적변수를 비교할 때 적합한, 데이터 분석 방법
     - 질적변수독립변수(Factor)가 다름에 따라, 양적변수종속변수와의 인과관계 효과 분석
        . 범주화독립변수(원인)들의 질적인 다름(요인별 각기 다른 수준의 처리)이,
        . 양적인 종속변수(결과)에 미치는 영향 분석
     - 例) 성별,혈액형이 다른 집단 간에 키,몸무게,심박수가 차이에 대해 유의성이 있는지 검정


3. 분산 분석의 검정 방법실험집단 간의 변동성실험집단 내의 변동성을 비교하여 검정함

  ㅇ 만일, 실험집단 간의 분산이 실험집단 내의 분산 보다 크다면 집단 간 차이의 유의성 존재
     - 집단 간 분산은, 실험 효과의 차이를 나타냄
     - 집단 내 분산은,  우연성(오차)의 크기를 나타냄

     * 한편, 실험집단 간 변동성에 대한 실험집단 내 변동성 비율F 통계량이라고 함


4. 분산 분석의 종류독립변수(Factor)의 수에 따라
     - 일원 분산분석 (one-factor ANOVA)
        . 하나의 실험요인 만으로 비교 (例,성별에 따른 키 비교)
     - 이원 분산분석 (two-factor ANOVA)
        . 두개의 실험요인으로 비교 (例,토양,강수량에 따른 농작물수확량 비교)
     - 다원 분산분석 (many-factor ANOVA)
        . 셋 이상의 실험요인으로 비교 

  ㅇ 독립변수수준(Level)에 대한 데이터 개수에 따라
     - Balanced ANOVA
     - Unbalanced ANOVA


5. 분산 분석의 용어 및 의미

  ㅇ 그룹(집단) : 군 또는 수준 이라고도 함

  ㅇ 요인 : 각 그룹(집단)을 구분짓게 하는 것
     - 요인/실험요인/인자/독립변수(Factor) 라고도 함

  ㅇ 그룹 간 편차 : (그룹 평균값) - (전체 평균값)
     - 그룹 평균의 분산으로써, 요인 차이의 효과를 나타냄
  ㅇ 그룹 내 편차 : (각 데이터값) - (그룹 평균값)
     - 통계 오차 효과를 나타냄

  ㅇ 만일, 
     - 그룹 간 편차 > 그룹 내 편차 이면, => 요인 차이에 의한 효과가 있음 (유의성 있음)
     - 그룹 간 편차 < 그룹 내 편차 이면, => 결과는 우연

  ㅇ 데이터자유도
     - 그룹 간 편차자유도 : (그룹 수) -1
     - 그룹 내 편차자유도 : (그룹 수) x (그룹 내 데이터의 수 -1)


[분산분석] 1. 분산분석

 
        최근수정     요약목록     참고문헌