Categorical Data   범주형 자료, 범주적 자료, 범주 자료

(2021-06-16)

Qualitative Data, 질적 자료, 질적 데이터, 질적 변수, Categorical Variable, 범주 변수, 범주형 변수


1. 범주 자료 (Categorical Data) / 질적 자료 (Qualitative Data)   ☞ 자료 분류 참조색깔,지역,직업,설문결과,사회계급,학력 등 `범주화/식별성 및 서열 정도 만` 가능한 자료


2. 범주형 자료의 특징사칙연산 의미 없음
     - 즉, 평균, 표준편차 등을 구하는 것은 의미 없음

  ㅇ 주로, 범주에 속하는 개체 수(도수) 만을 분석 대상으로 삼음
     - 주요 분석 표 : 통계 분할표(Contingency Table) 등


3. 범주형 자료의 구분

  ㅇ 명목 자료 (Nomial Data)
     - 어떤 속성을 분류하기 위해 수치 부여
        . 例) 남 1,여 0, 혈액형(A,B,O,AB) 등
           .. 여기서, 남 1,여 0 2개 수치화하는 것을, 수준 이라고 함

  ㅇ 서열 자료 (Ordinal Data)
     - 상대적인 크기 비교
        . 例) 사회계급,선호순위,학력 등


4. 범주형 자료의 `변환`,`표현`,`적용`

  ㅇ 변환 (질적 자료 → 양적 자료)
     - 질적 자료를 이산적으로 수치화시킴
        . 어떤 범주(Category)에 속하는 데이터들을 하나의 사건에 대응시켜 수치 부여
        . 통상, 어떤 속성에 따라 분류시켜 도수(Counting)화한 자료

     - 例) 품질수준(상,중,하 3개 범주),고장종류(기계고장,전기고장,사용자오작동 3개 범주) 등

  ㅇ 표현 (자료 정리 및 표현 형태)
     - 표 또는 그래프의 형태로 정리 함                         ☞ 통계 자료 표현 참조
        . 例) 표 : 통계 분할표 : 자료 항목 간에 관계성을 찾기 위한 표
        . 例) 그래프 : 막대 그래프, 파이 그래프 등
     - 자료(데이터)들을 통계적으로 하나의 수치량으로 축약      ☞ 통계량 참조

  ㅇ 적용    ☞ 통계분석 참조
     - 질적 자료(변수)들 간에 관계 분석
     - 자료(변수) 간에 변화 예측5. 범주형 자료의 분석

  ㅇ 주요 분석 표 : 통계 분할표(Contingency Table) 등
  ㅇ 두 범주의 연관성의 정도 : 빈도 차이,분포로 측정 가능
  ㅇ 두 범주형 자료(변수) 간에 관계가 있는지 여부를 검정 : 피어슨의 카이제곱 검정



Copyrightⓒ   차재복 (Cha Jae Bok)