- 한국어 어휘의미망 U-WIN을 이용한 한국어 복합명사 의미 분석
- ㆍ 저자명
- 배영준,옥철영,Bae. Young-Jun,Ock. Cheol-Young
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2013년|40권 12호|pp.833-847 (15 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
현재까지 대부분의 한국어 처리 시스템에서는 복합명사 분석을 위해 많은 명사와 복합명사를 사전에 등재하여 처리하였다. 그러나 복합명사를 모두 사전에 등재하는 것은 한계가 있으므로 명사 간의 관계 또는 동형이의어 명사의 의미 분석 등을 통해서 미등재 복합명사를 분석할 필요가 있다. 본 논문에서는 어휘의미망(U-WIN)을 이용한 한국어 복합명사 의미 분석 방법을 제안한다. 복합명사 의미 분석을 위해 표준국어대사전에서 추출한 27,761개의 복합명사를 대상으로 실험하였다. 실험을 위해 세종 말뭉치에서 추출한 방향별 bigram 단위의 학습데이터를 두 집합으로 구축하고, 품사 패턴과 U-WIN을 통해 학습데이터를 확장하여 자료 부족 문제를 일부 해결한다. 그리고 미등록 복합명사를 처리를 위해 U-WIN을 통한 상위 탐색 방법을 이용해 가중치를 확보한 후 의미 분석에 사용한다. 실험한 결과 복합명사의 의미 분석은 86.20%의 정확률을 보였다. 그리고 위치 정보를 고려하지 않은 기존의 유사도 추출 기법과의 실험결과를 비교했을 때 본 논문의 방법이 정확률에서 9.6% 더 높은 성능을 보였다.
In order to analyze Korean compound nouns, most of Korean processing systems have stored nouns and compound nouns in dictionary. However, this approach is limited because most of Korean compound nouns are very productive. Therefore, it is necessary to analyze the unregistered Korean compound nouns semantically using a relation of nouns and semantic analysis of homonym. In this paper, we propose a method for semantic analysis of Korean compound noun using lexical semantic network (U-WIN). 27,761 compound nouns of the Standard Korean Language Dictionary were used for experiments. For the experiments we constructed training sets of bigram units. To solve a problem of data sparseness we constructed more training set using U-WIN. The weighting methods of allocation and acquisition are used for semantic analysis of unregistered compound nouns. The result of the experiment showed a accuracy of 86.20%. The approach improved a accuracy of 9.6% than the existing approach without using the position information.