[정보통신기술용어해설] |
언어학 용어 | (2024-04-27) |
코퍼스, 품사, 띄어쓰기 |
1. 언어학 용어 ㅇ 코퍼스 (Corpus) : 말뭉치, Text Dataset - 자연어 연구를 위해 특정 방식으로 추출된 언어 표본들의 집합 ㅇ 품사 (part of word) : 단어를 기능,형태,의미에 따라 나눈 갈래 (명사,조사,동사,형용사,부사 등) ㅇ 형태소 (Morpheme) : 의미를 가지는 요소로서는 더이상 분석할 수 없는 최소의 문법 단위 ㅇ 띄어쓰기 (spacing words) : 단어의 구분 (공백으로 단어 간을 분리함) - 띄어쓰기 함 : 영어,한글 등, 띄어쓰기 안함 : 중국어,일어 등 ㅇ (...편집중...)