1. 자료(데이터)의 분류/구분
※ 수집된/제시된 자료가 어떤 유형인지에 따라, 그 분석/처리하는 방법에 큰 차이를 보임
ㅇ (범주형) 질적 자료 (Qualitative Data), 범주 자료 (Categorical Data)
* 색깔,지역,직업,설문결과,사회계급,학력 등 `범주화/식별성 및 서열 정도 만` 가능
- 범주형 구분 ☞ 통계 척도 참조
. 명목 자료 (Nomial Data)
.. 어떤 속성을 분류하기 위해 수치 부여 (例, 남 1,여 0,혈액형 등)
. 서열 자료 (Ordinal Data)
.. 상대적인 크기 비교 (例, 사회계급,선호도,만족도,학력 등)
- 범주형 특징
. 사칙연산 의미 없음
- [참고]
. 자료의 식별 ☞ 개체, 식별 참조
. 자료의 코드화 ☞ 코드, 상품코드(바코드,QR코드,RFID 등) 참조
. 자료의 컴퓨터 표현 ☞ 알파뉴메릭 코드(ASCII,유니코드 등), 기본자료형 등 참조
ㅇ (수치형) 양적 자료 (Quantitative Data), 수치 자료 (Numerical Data)
* 나이,소득,매출액 등 수량화 가능 (수량적 자료)
- 수치형 구분 (수치 부여 유형에 따라 구분) ☞ 통계 척도 참조
. 등간 자료, 구간 자료 (Interval Data)
.. 간격이 균등한 수치 부여 (例, 온도,IQ 등)
. 비율 자료 (Ratio Data)
.. 균등 간격에 절대 영점 있음 (例, 나이,소득,무게,방문자수 등)
.. 따라서, 비율 표현 및 비교가 자연스러움
- 수치형 구분 (셀 수 있음 여부에 따라 구분)
. 계수치 (이산적, Discrete)
.. 셀 수 있는 정수 값 (例, 생산개수,불량수,나이 등)
. 계량치 (연속적, Continuous)
.. 연속 값 (例, 길이,무게,인장강도,온도,시간 등)
- 수치형 특징
. 사칙연산 가능
- [참고]
. 자료의 수치화 ☞ 셈법, 수 표현(진법체계,고정소수점,부동소수점 등) 참조
. 컴퓨터 숫자형 표현 ☞ 수치 코드, 컴퓨터 수 체계, 기본자료형(숫자형) 참조