Variance   분산

(2017-04-20)

분산

1. 분산 (Variance)

  ㅇ 자료들의 불규칙한 분포 정도를 나타내는 통계량   
     - 자료들이 기대값(평균값)으로부터 얼마나 퍼져 있는가를 가늠해볼 수 있음


2. 분산의 활용산포의 경향을 알기위해 분산 및 표준편차가 많이 사용됨
     - 주어진 자료들의 평균, 최소, 최대 값 만으로는 자료 특성 파악이 어려움
     - 특히, 자료들의 산포의 경향(흩어짐의 정도) 또는 자료가 평균을 중심으로,
     - 어떻게 흩어져 있는가를 알고자 할 때가 그런 경우임


3. 분산의 표현

  ㅇ 분산 이란?
     - 편차 제곱 합(변동)을 데이터 수로 나눈 값        ☞ 변동성(Variability) 참조
        . 편차 = (데이터값) - (평균값)
        . 변동 = (편차 제곱 합) = (편차 1)2 + (편차 2)2 + ...

     - 분산 = (변동) / (데이터 수) = (편차 제곱 합) / (데이터 수)
        . 즉, 제곱된 편차산술평균 임

     - 결국, 분산은, 변동성(Variability) 개념을 평균 개념으로 요약한 것임

  ㅇ 분산의 표기
     - 보통  Var[X] 또는 σX2 또는 σ² 등으로 표기

     -   Var[X]  =  E [(X-μX)2]  =  σX2
        . 즉, X의 기대값에서 떨어진 거리(편차)의 제곱의 평균과 같음


4. 분산의 형상에 따른 의미

  ㅇ 분산이  0 에 가까울수록,
     - 자료의 산포 변동이 심하지 않으며, 
     - 대체로 자료들이 평균에 몰려 있음을 의미함


5. 분산의 계산

  ㅇ 자료 분산 (Data Variance)
     
     - (N : 자료 개수, N-1 : 자유도, X- : 자료 평균)

  ㅇ 모 분산 (Population Variance)
     
     - (N : 모집단 개수, μ : 모 평균)

  ㅇ 표본 분산 (Sample Variance)
     
     - (n : 표본 개수, n-1 : 자유도, x- : 표본 평균)


6. 분산의 성질(관계식)

   


[통계량] 1. 통계량 2. 중앙값(Median) 3. 최빈값(Mode) 4. 평균(Mean) 5. 기대값(Expectation) 6. 편차/변동/변동계수 7. 표준편차(Standard Deviation) 8. 분산(Variance) 9. 분위수 10. 모멘트(원점적률,중심적률) 11. 적률생성함수 12. 왜도 13. 첨도 14. 비율

 
        최근수정     모바일웹     참고문헌