- 일한대역문의 문장과 단락의 정렬
- Sentence and Paragraph Alignment in Japanese to Korean Parallel Corpora
- ㆍ 저자명
- 황도삼=DosamHwang
- ㆍ 간행물명
- 인지과학
- ㆍ 권/호정보
- 1996년|7권 4호|pp.179-202 (24 pages)
- ㆍ 발행정보
- 한국인지과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
최근 대역 텍스트를 이용한 자연언어처리의 연구가 활발히 진행되고 있으며 이와 같은 연구에서는 대량의 대역 택스트가 사용되고 있다. 그런데,원문과 번역문이 반드시 1대1로 대응하지 않으므로 실제 연구에 사용하기 위해서는 원문과 번역문을 대응시켜야 한다.그러나,수작업으로 문대응을 하는 것은 대단히 어려운 작업이다.한편,인간의 문대응의 처리과정을 보면 우선,원문을 번역하고,이 번역문과 비슷한 문을 번역문 중에서 찾아내어,원문과 대응시킨다고 생각된다.본 논문에서는 인간의 문대응 방법에 근거하여 컴퓨터를 이용한 자동 문대응 방법을 제시한다.본 방법을 이용하여 일본어 문과 한국어문의 대역 텍스트 약 2,390문에 대하여 실험한 결과,문대응 성공률이 99.6%이었다. 주제어:정렬,대역문,일본어,한국어,유사도,번역
Large-scale bilingual texts have recently been used in various aspects of Natural Language Processing research.However,when one source sentence is translated,it is not always translated to one target sentence.Since one sentence can be translated into two or more sentences and vice-versa, sentences in these texts must be aligned to be useful for the research.It takes too much time to align bilingual texts by hand.To align sentences by hand we,human,first translate source sentences to target sentences, and then we make source sentences to correspond to target sentences in the text that are similar to the converted sentences.This paper presents computer aided sentence alignment method based on human"s aligning method.Using the method presented in this paper we reached 99.6% success rate for the 2,390sentences of the bilingual Japanese to Korean text. Keyword:aligment,bilingual text,Japanese,Korean,Analogy,Ttranslation