Variance   분산 [통계], 분산 (Variance)


   

분산 [Variance]

     (수정일:2018-06-26)

 
  1. 분산 (Variance)
    1. 자료들의 불규칙한 분포 정도를 나타내는 통계량
      1. 자료들이 기대값(평균값)으로부터 얼마나 퍼져 있는가를 가늠해볼 수 있음
  2. 분산의 활용
    1. 산포의 경향을 알기위해 분산 및 표준편차가 많이 사용됨
      1. 주어진 자료들의 평균, 최소, 최대 값 만으로는 자료 특성 파악이 어려움
      2. 특히, 자료들의 산포의 경향(흩어짐의 정도) 또는 자료가 평균을 중심으로,
      3. 어떻게 흩어져 있는가를 알고자 할 때가 그런 경우임
  3. 분산의 표현
    1. 분산 이란?
      1. 편차 제곱 합(변동)을 데이터 수로 나눈 값 ☞ 변동성(Variability) 참조
    2. 즉, 분산은 제곱된 편차들의 산술평균
      1. 편차 = (데이터값) - (평균값)
      2. 변동 = (편차 제곱 합) = (편차 1)2 + (편차 2)2 + ...
      3. 분산 = (변동) / (데이터 수) = (편차 제곱 합) / (데이터 수)
      4. * 결국, 분산은, 변동성(Variability) 개념을 평균 개념으로 요약한 것임
    3. 분산의 표기
      1. 보통 Var[X] 또는 σX2 또는 σ² 등으로 표기
    4. 분산의 표현식
      1. Var[X] = E [(X-μX)2] = σX2
        1. 즉, 편차(평균에서 떨어진 거리)의 제곱의 기대값과 같음
      2. 한편, 행렬,벡터에 의한 분산의 표현식
        1. 편차 벡터 : x = (x1 - x̅, ... , xn - x̅)
        2. 분산 : Var[X] = (1/n) xTx = (1/n) <x,x>
  4. 분산의 형상에 따른 의미
    1. 분산이 0 에 가까울수록,
      1. 자료의 산포 변동이 심하지 않으며,
      2. 대체로 자료들이 평균에 몰려 있음을 의미함
  5. 분산의 계산식
    1. 자료 분산 (Data Variance)
      1. (N : 자료 개수, N-1 : 자유도, X- : 자료 평균)
    2. 모 분산 (Population Variance)
      1. (N : 모집단 개수, μ : 모 평균)
    3. 표본 분산 (Sample Variance)
      1. (n : 표본 개수, n-1 : 자유도, x- : 표본 평균)
  6. 분산의 성질(관계식)
    1. Var[X] = E[X2] - μX2
    2. Var[X] = E[X(X-1)] + E[X](1 - E[X])
    3. Var[aX + b] = a2 Var[X]


Warning: Invalid argument supplied for foreach() in C:\htdocs\ktword\m\m_tree.php on line 32

       최근수정이력     PC 화면