1. 범주 자료 (Categorical Data) / 질적 자료 (Qualitative Data) ☞ 자료 분류 참조
ㅇ 색깔,지역,직업,설문결과,사회계급,학력 등 `범주화/식별성 및 서열 정도 만` 가능한 자료
ㅇ 例) 예/아니오, 동전의 앞과 뒤, 맑음/흐름/눈/비, 식당의 메뉴 등
2. 범주형 자료의 특징
ㅇ 사칙연산 의미 없음
- 즉, 평균, 표준편차 등을 구하는 것은 의미 없음
ㅇ 주로, 범주에 속하는 개체 수(도수) 만을 분석 대상으로 삼음
- 주요 분석 표 : 통계 분할표(Contingency Table) 등
3. 범주형 자료의 구분
ㅇ 명목 자료 (Nomial Data)
- 어떤 속성을 분류하기 위해 수치 부여
. 例) 남 1,여 0, 혈액형(A,B,O,AB) 등
.. 여기서, 남 1,여 0 2개 수치화하는 것을, 수준 이라고 함
ㅇ 서열 자료 (Ordinal Data)
- 상대적인 크기 비교
. 例) 사회계급,선호순위,학력 등
4. 범주형 자료의 `변환`,`표현`,`적용`
ㅇ 변환 (질적 자료 → 양적 자료)
- 질적 자료를 이산적으로 수치화시킴
. 어떤 범주(Category)에 속하는 데이터들을 하나의 사건에 대응시켜 수치 부여
. 통상, 어떤 속성에 따라 분류시켜 도수(Counting)화한 자료
- 例) 품질수준(상,중,하 3개 범주),고장종류(기계고장,전기고장,사용자오작동 3개 범주) 등
ㅇ 표현 (자료 정리 및 표현 형태)
- 표 또는 그래프의 형태로 정리 함 ☞ 통계 자료 표현 참조
. 例) 표 : 통계 분할표 : 자료 항목 간에 관계성을 찾기 위한 표
. 例) 그래프 : 막대 그래프, 파이 그래프 등
- 자료(데이터)들을 통계적으로 하나의 수치량으로 축약 ☞ 통계량 참조
ㅇ 적용 例) ☞ 통계분석, 기계학습 용어 등 참조
- 질적 자료(변수)들 간에 관계 분석
- 자료(변수) 간에 변화 예측
- 분류 (Classification)
. 주어진 데이터를 어떤 부류(분류범주,분류영역,클래스,카테고리)에 속하는지를 판단하는 것
5. 범주형 자료의 분석
ㅇ 주요 분석 표 : 통계 분할표(Contingency Table) 등
ㅇ 두 범주의 연관성의 정도 : 빈도 차이,분포로 측정 가능
ㅇ 두 범주형 자료(변수) 간에 관계가 있는지 여부를 검정 : 피어슨의 카이제곱 검정 등