- 한국어 어휘의미망의 의미 관계를 이용한 어의 중의성 해소
- ㆍ 저자명
- 김민호,권혁철,Kim. Min-Ho,Kwon. Hyuk-Chul
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2011년|38권 10호|pp.554-564 (11 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
자연언어처리에서 어의 중의성 해소는 여러 개의 의미로 사용될 수 있는 중의성 어휘가 특정 문맥에서 어떤 의미로 사용되었는지를 결정하는 것이다. 어의 중의성 해소는 기계번역이나 정보검색과 같은 많은 자연언어처리 응용에서 중요한 역할을 한다. 본 논문은 한국어 어휘의미망에 기반을 둔 비감독어의 중의성 해소 방법을 제안한다. 중의성 어휘의 주변 문맥에 나타나는 공기 어휘는 중의성 어휘의 의미를 판단하는 중요한 단서가 된다. 중의성 어휘와 공기 어휘 간 연관성을 카이제곱(chi-square) 통계량을 바탕으로 계산하여 어의 중의성 해소에 이용한다. 한국어 어휘의미망에서 중의성 어휘의 의미별 관계어를 찾고, 이들과 공기 어휘 간 공기 빈도를 대규모 말뭉치로부터 획득하여 카이제곱 통계량을 계산한다. 이때, 가장 큰 카이제곱 통계량을 가지는 관계어의 의미가 중의성 어휘의 의미가 된다. 새로운 비감독 어의 중의성 해소는 10개의 중의성 어휘에 대하여 평균 86.2%의 어의 중의성 해소 정확도를 보였다.
The goal of word sense disambiguation(WSD) is to determine which sense of an ambiguous word is invoked in a particular use of the word. It plays an important role in many natural language processing applications such as machine translation and information retrieval. This paper proposes a method for automatic word sense disambiguation based on Korean WordNet. The basic assumption of this suggested method is that contextual words provide strong and consistent clues to the sense of an ambiguous word. Relevance between the ambiguous words and its contextual words is used to disambiguate the sense of the target word. In this paper, relevance between the ambiguous words and its contextual words is calculated by chi-square statistics. In tum, the chi-square between the ambiguous words and its contextual words is obtained from the related words of the target word in Korean WordNet and their co-occurrence extracted from a large unannotated corpus. A word sense having maximum chi-square with contextual words is selected as right sense in the given sentence. Ten ambiguous nouns have been disambiguated by the proposed method. The result of experiment shows that the model obtains 86.2% average accuracy.