N-gram   엔그램

(2026-05-20)

1. N-gram 이란?

  ㅇ "N개 단위의 연속 묶음"
     - N (묶는 개수), gram (기록된 단위, 문자 조각 등)

  ㅇ 연속적으로 나타나는 N개의 단어(또는 문자) 묶음
     - 언어 데이터 내 "인접한 항목들의 연속 패턴"을 다루는 표현 방법
        . 문장 내 단어 연속성을 바탕으로, 다음 출현 단어 확률 예측

  ㅇ 例) "I love artificial intelligence"
     - 1-gram (Unigram)  :  I, love, artificial, intelligence
     - 2-gram (Bigram)  :  I love, love artificial, artificial intelligence
     - 3-gram (Trigram)  :  I love artificial, love artificial intelligence

     * 주로, 다음 단어 예측을 위해 사용됨
        . "artificial" 다음에 "intelligence"가 자주 나오면, 다음 단어 확률을 높게 판단

  ㅇ 용도
     - 검색어 추출, 철자 교정, 텍스트 검색, 텍스트 유사도 측정, 자동 분류 등에 사용

LLM, NLP
1. 자연어 처리 (NLP)   2. 자연어 처리 용어   3. N-gram   4. 편집 거리   5. 언어 모델   6. 대규모 언어 모델 (LLM)   7. 임베딩   8. 어텐션   9. 트랜스포머  
용어해설 종합 (단일 페이지 형태)

"본 웹사이트 내 모든 저작물은 원출처를 밝히는 한 자유롭게 사용(상업화포함) 가능합니다"
     [정보통신기술용어해설]