자료 분류, 데이터 분류

(2017-04-04)

Categorical Data, 범주형 자료, 범주적 자료, Qualitative Data, 질적 자료, 질적 데이터, 질적 변수, Quantitative Data, 양적 자료, 양적 데이터, 양적 변수

1. 자료 분류/구분

  ㅇ 수량화 여부에 따른 구분
     - 질적 자료 (Qualitative Data) / 범주적 자료 (Categorical Data)
        . 색깔,성,지역,직업,설문조사결과 등 범주화 만 가능 

     - 양적 자료 (Quantitative Data) 
        . 나이,소득,매출액 등 수량화 가능     (수량적 자료)
           .. 계수치(이산적) : 셀 수 있는 정수 값 (例, 생산개수,불량수 등)
           .. 계량치(연속적) : 연속 값 (例, 길이,무게,인장강도,온도,시간 등)

  ㅇ 속성에 따른 구분                                                   ☞ 통계 척도 참조
     - 질적 자료 / 범주 자료
        . 명목 자료(Nomial Data) : 어떤 속성을 분류하기 위해 수치 부여 (例, 남 1,여 0 등)
        . 서열 자료(Ordinal Data): 상대적인 크기 비교 (例, 사회계급,선호순위 등)
        * 사칙연산 의미 없음

     - 양적 자료 
        . 등간 자료/구간 자료(Interval Data) 
           .. 간격이 균등한 수치 부여 (例, 온도,IQ 등)
        . 비율 자료(Ratio Data)
           .. 균등 간격에 절대 영점 있음 (例, 나이,소득,무게 등)
        * 사칙연산 가능


2. 질적/범주형 자료의 변환, 표현, 적용

  ㅇ 변환 (질적 자료 → 양적 자료)
     - 질적 자료를 이산적으로 수치화시킴
        . 어떤 범주(Category)에 속하는 데이터들을 하나의 사건에 대응시켜 수치 부여
        . 통상, 어떤 속성에 따라 분류시켜 도수(Counting)화한 자료

     - 例) 품질수준(상,중,하 3개 범주),고장종류(기계고장,전기고장.사용자오작동 3개 범주) 등

  ㅇ 표현 (자료 정리 및 표현 형태)                                   ☞ 통계 자료 표현 참조
     - 주로, 통계 분할표(Contingency Table)의 형태로 정리 함         

  ㅇ 적용
     - 질적 자료(변수)들 간에 관계 분석
     - 자료(변수) 간에 변화 예측 등


[통계적 기술(記述)] 1. 기술 통계학 2. 자료 분류 3. 자료 표현 4. 히스토그램 5. 산포도 6. 도수분포표 7. 상자 그림 8. 줄기 잎 그림 9. 통계 분할표 10. 파레토도

 
        최근수정     모바일웹     참고문헌