1. 임베딩 (Embedding) : (벡터 공간 표현)
ㅇ 의미를 컴퓨터가 처리 가능한 수치 좌표로 바꾸는 방법
- 과거 : 사람이 특징(Feature)을 직접 설계
- 현대 : 데이터 의미를 "벡터 공간"에 자동 배치
* 즉, "의미적 유사성"을 수학적으로 계산할 수 있게 해줌
ㅇ 배치 방식 : 비슷할수록 벡터 공간 내 가까이 배치
- 즉, 의미 유사성, 문맥 유사성, 패턴 유사성을 공간 거리로 표현
ㅇ 구분
- Word Embedding
- Sentence Embedding
- Vector Embedding
- Semantic Embedding
- Latent Embedding
- Embedding Space
ㅇ 활용
- LLM에서, 토큰 → 임베딩 벡터 변환 → 신경망 처리 구조 사용
. 즉, 단어를 숫자 ID로만 처리하는 게 아니라, "의미 공간 좌표"로 변환
- 멀티모달에서, 텍스트,이미지,음성 등을 공통 벡터 공간에 넣음
. 例) "고양이" 텍스트, "고양이" 사진들을, 가까운 임베딩 생성
. 단어,이미지,음성 등을 의미 기반의 벡터 공간으로 매핑