1. 전처리 / 선행처리 (Preprocessing) 이란?
ㅇ 일반적으로, 다루기 쉬운 형태로 변환시키는 과정
2. [데이터 분석]
ㅇ 자료(데이터)의 분석/처리 과정
- 전처리 과정 -> 기초 통계분석 과정 -> 모델 구축 과정 -> 평가 과정
ㅇ 주요 전처리 대상
- 결측값 (Missing Value) : 비어있는 데이터를 삭제 또는 채움
- 이상치 (Outlier Value) : 비정상적인 이상 값의 제거 또는 대체
. [참고] ☞ 강건성, 중앙값 등 참조
- 중복값 (Redundancy Value) : 중복 데이터 중 하나 만 남기고 제거
ㅇ 전처리 과정 특징
- 많은 정보를 버릴 수 있음
- 핵심 계산 과정의 속도를 높일 수 있음
※ [참고] ☞ 특징 추출 참조
- 핵심적인 특징 만을 추출
3. [전산] 전처리 / 선행 처리
ㅇ 컴파일하기 전에 원시 프로그램을 단순 처리하는 컴파일러의 한부분
- 단지 텍스트 조작에 불과하고, 문법이나 의미에 대해서는 거의 고려치 않음
ㅇ 전처리기 주요 역할들
- 주석 제거
. 컴파일 과정에 번역이 되지 않도록, 원시 프로그램 상의 주석을 제거
- 매크로(Macro) 치환/확장
. 단순 매크로 : 기호를 정의된 상수(수치값,문자열 등)로 치환
.. 장점 : 프로그램 가독성 증대, 상수 정의,변경 용이 등
. 함수 매크로 : 매크로가 함수 처럼 매개변수를 갖는 것
.. 장점 : 함수 호출 단계의 불필요로 실행 속도 향상
(함수 작성 않고서도 함수 사용 가능)
.. 단점 : 소스코드 길이가 길어짐
- 컴파일하기 전에 특정 문장을 다른 문장으로 전환
- 특정 파일의 내용을 병합/포함
- 조건부 컴파일 등
※ 대부분의 현대 언어에서는,
- 전처리기가, 컴파일러 내부에 자연스레 통합된 매우 작은 기능인 반면에,
- C언어에서는, 전처리기 자체가 독립된 기능을 수행할 정도로 다양하게 쓰임
4. [전산, C 언어] 전처리 / 선행 처리
※ C 언어에서, ☞ 전처리 지시자 참조
- #include (헤더파일 병합), #define (매크로 정의), #if (조건부 컴파일) 등