1. 정규화 (Normalization), 정규화/규제 (Regularization), 정규성 (Normality)
ㅇ [과학일반]
- 값을 일정 기준으로 맞추거나,
- 비교 가능하도록 스케일을 조정하는 등
- 또는, 비정상적인 특이값(outlier) 완화 등을 포함하기도 함
* 특히, 단위(척도)가 서로 다른 량(量)들 간의 손쉬운 비교를 위해 많이 쓰임
* 사실상, "정규화"는, 분야마다 약간씩 의미가 다름
. DB → 구조 분해
. 벡터 → 길이 1
. 기계학습 → 스케일 조정 등
ㅇ [DB] (정규화, Normalization)
- 데이터 중복 최소화 및 데이터 무결성 확보를 위한, DB 구조 설계 과정
.. 테이블을 주제별로 분해 : (제1 ~ 제3 정규형 등)
ㅇ [벡터] (정규화, Normalization)
- 벡터의 크기를 1로 만드는 것 (단위 벡터화) ☞ 벡터 정규화
ㅇ [신호처리 / 데이터 처리] (정규화, Normalization)
- 데이터 범위를 일정 구간으로 변환
. Min-Max 정규화 (최소-최대 정규화) : 데이터 값을 0 ~ 1 사이의 범위로 조정
.. {#x' = \frac{x-x_{min}}{x_{max}-x_{min}} #}
. Z-score 정규화
.. x' = (x - μ) / σ
ㅇ [기계학습]
- 정규화 (Normalization)
. 입력 데이터 특성(Feature)들의 값 범위를 맞추어, 학습을 안정화시키는 전처리 기법
.. Min-Max 정규화, Z-score 정규화 등
- 정규화/규제 (Regularization)
. 모델 복잡도를 제한하여, 과적합 방지
.. L1, L2 정규화 등
. 목적함수에 패널티 항 추가
.. 목적함수 = 손실 + λ·복잡도
ㅇ [확률] (정규성, Normality)
- 대부분의 자연현상을 가장 잘 설명하는 종 모양의 확률분포를 지칭 ☞ 정규 분포, 정규성 검정 참조
. 많은 수학자(통계학자)가, 종 모양(bell-shaped)의 거의 모든 분포가,
. 가우스 분포를 보인다하여, 이것을 정규 분포(normal distribution)라고 부름
- 정규 분포를 표준화/정규화시킴 ☞ 표준 정규분포(Z 분포), z 값
. (정규 분포의 평균을 0, 표준편차를 1로 맞춤)
.. Z = (X - μ) / σ ☞ 표준정규분포 참조