Jaccard Similarity   자카드 유사도

(2025-07-21)

1. [기계학습]  자카드 유사도 (Jaccard Similarity) 벡터교집합합집합 비율을 이용한 유사도
     - 공통된 것들이 많을수록 유사하다고 판단 

  ㅇ 자카드 거리  :  두 문자열 간에 공통으로 포함된 글자가 많을수록 유사도 높음
     - 완전 일치 : 1, 공통 글자 없음 : 0
        . 단, 같은 글자들은 1글자로 계산됨
       
[# J(A,B) = \frac{|A \cap B|}{|A \cup B|} = \frac{|A \cap B|}{|A|+|B|-|A \cap B|} #]
ㅇ 활용 - 단어 사이의 유사도 : 통상, 공통 글자의 수와 단어의 길이로 판단

유사도
1. 닮음 (유사도)   2. 거리 (유사도 척도)   3. k 최근접 이웃 (KNN)   4. 레벤슈타인 거리   5. 자카드 유사도  
용어해설 종합 (단일 페이지 형태)

"본 웹사이트 내 모든 저작물은 원출처를 밝히는 한 자유롭게 사용(상업화포함) 가능합니다"
     [정보통신기술용어해설]          Copyrightⓒ 차재복