| [정보통신기술용어해설] |
Jaccard Similarity 자카드 유사도 | (2025-07-21) |
1. [기계학습] 자카드 유사도 (Jaccard Similarity) ㅇ 벡터의 교집합과 합집합 비율을 이용한 유사도 - 공통된 것들이 많을수록 유사하다고 판단 ㅇ 자카드 거리 : 두 문자열 간에 공통으로 포함된 글자가 많을수록 유사도 높음 - 완전 일치 : 1, 공통 글자 없음 : 0 . 단, 같은 글자들은 1글자로 계산됨[# J(A,B) = \frac{|A \cap B|}{|A \cup B|} = \frac{|A \cap B|}{|A|+|B|-|A \cap B|} #]ㅇ 활용 - 단어 사이의 유사도 : 통상, 공통 글자의 수와 단어의 길이로 판단