기계학습 용어

(2024-09-01)

기계학습 과정, 과적합, 레이블


1. 기계학습의 용어기계학습 (Machine Learning)
     - 데이터들로부터, 특징,패턴을 감지하여, 규칙,알고리즘,지식 등을 자동으로 학습,확장시킴

  ㅇ 라벨(레이블) (Label)
     - 데이터에 대한 정답 또는 목표 값
        . 즉, 모델학습하는 동안 예측하고자 하는 대상
        . 주로, 지도학습에서 사용됨
        . 쉽게, 분류 명칭 (class label)

  ㅇ 차원 (Dimension)
     - 데이터의 각 변수 또는 속성을 의미
        . 例) 의료 데이터 : 환자의 나이,혈당 수치,염증 지표 등 여러 속성을 포함하는 벡터로 표현 

  ㅇ 특징 (Feature)
     - 데이터의 특징을 나타내는 정보 (두드러지고, 풍부한 정보를 주는 것)
        . 例) 키와 체중으로 성별을 예측할 때, 키,체중을 특징이라고 함
     - 특징 벡터  :  데이터에서 특징으로 간주되는, 1 이상의 변수들로 구성된 벡터
     - 특징량  :  데이터에서 나타나는 변화를, 1 이상의 변수들(특징 벡터)로 나타낸 계산식

  ㅇ 패턴 (Pattern)
     - 데이터들에서 나타나는 좋은 특징들을 모아놓은 집합패턴 인식 (Pattern Recognition)
     - 핵심이 되는 특징 추출과 이를 분류하는 것

  ㅇ 모델 (Model)
     - 데이터로부터 학습하여, 예측,분류 등을 수행하는, 알고리즘 또는 수학적 구조
     * [참고] ☞ `기계학습의 모델화 과정` 참조

  ㅇ 학습 (Learning)
     - 지속적인 경험이나 훈련의 결과로 생기는 행동 변화

  ㅇ 트레이닝 세트 (Training Set), 학습 데이터
     - 학습에 사용되는 샘플 데이터
        . 데이터가 어떻게 구성된지(많거나,적거나,치우치거나)에 따라 학습 성능이 크게 달라짐
           .. 무작위로 뽑아 작은 데이터셋을 만들거나, 중요도에 따라 크게 또는 작게 선택하는 등

  ㅇ 일반화 (generalization)
     - 훈련 단계에서 사용하지 않은 예시들에 대해서도 올바르게 분류하는 능력

  ㅇ 과적합 (Overfitting)
     - 학습 데이터와 유사한 데이터에 만 잘 작동하고, 다른 데이터에는 일반화하기 어려운 현상

  ㅇ 이미지 인식
     - 필요 : 상품 인식, 얼굴 인식, 도로 상황 파악 등
     - 분류 : 물체 분류, 물체 인식 등

  ㅇ 통계 기반 기계학습
     - 통계학적으로 대규모 데이터에 내재된 패턴을 찾아내는 학습 모델
     * 크게, 빈도주의 통계법(기존)과 베이즈 통계법으로 구분 가능


2. 기계학습의 수행 방식 (문제 유형, 적용 대상)회귀 (Regression) : 입력 값을 바탕으로 연속적인 출력 값을 추정/예측분류 (Classification) : 입력 값을 바탕으로 특정 범주를 추정/예측군집화 (Clustering) : 입력 값들을 비슷한 특성별로 여러 그룹으로 분할하며 큰 단위로 만들어 감

기계학습
   1. 기계 학습   2. 기계학습 용어   3. 기계학습 종류   4. 기계학습 모델   5. 기계학습 응용   6. 인공 신경망 (ANN)   7. 분류   8. 군집화   9. 차원 축소   10. 서포트 벡터 머신 (SVM)  


"본 웹사이트 내 모든 저작물은 원출처를 밝히는 한 자유롭게 사용(상업화포함) 가능합니다"