- 자연어 인터페이스를 위한 관계에 대한 자연어 표현 자동 수집 방법
- ㆍ 저자명
- 한용진,박세영,박성배,Han. Yong-Jin,Park. Se-Young,Park. Seong-Bae
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2011년|38권 10호|pp.536-542 (7 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
관계에 대한 다양한 자연어 표현을 다루는 것은 구조 정보에 대한 자연어 정의 인터페이스 연구의 중한 문제 중에 하나이다. 이러한 문제를 해결하기 위한 기존의 연구들은 자연어 질의 인터페이스를 대상 분야에 적합하게 구축하기 위한 수작업에 의존하였다. 이러한 접근은 소규모 구조 정보에 대한 자연어 질의 인터페이스 구축 시 효율적으로 적용될 수 있다. 하지만 최근에는 RDF와 OWL과 같은 그래프 구조 정보가 다양한 분야에서 대량으로 생성되고 있다. 수작업에 의존하는 접근을 통해 이러한 대량의 그래프 구조 정보에 대한 자연어 인터페이스를 구축하기에는 어려움이 있다. 본 논문은 자연어 인터페이스에 대한 자연어 표현의 다양성 문제를 해결하기 위해 자동으로 관계에 대한 자연어 표현을 수집하는 방법을 제안한다. 그래프 구조 정보에서 관계는 두 객체를 연결하는 유일한 에지(edge)로 표현된다. 제안한 방법은 주어진 에지로 연결되는 서로 다른 객체 쌍을 말뭉치(corpus)에서 검색하고 검색된 객체 쌍 주변에서 빈번하게 등장하는 자연어 표현을 수집한다. 자동으로 수집한 자연어 질의 표현을 자연어 인터페이스에 적용한 결과 수작업에 의존하는 기존 연구들과 비교할 만한 실험 결과를 보였다.
One of the critical problems in natural language interfaces (NLI) to structured data is to handle the large variability in the way that a relation can be expressed. Existing approaches to solve this problem rely on manual process to adapt NLI to a new domain. The manual approaches can be efficiently applied to small structured data. However, nowadays, large volumes of graph-structured data such as RDF and OWL have been produced from a variety of areas on the web. It is not easy to adapt NLI to such large graph structured data. As a solution of the variability problem in NLI, this paper proposes an automatic method to identify relations in natural language queries for NLI to graph structured data. A relation between two entities is uniquely defined as an edge linking the entities on graph-structured data. The proposed method automatically discovers natural language expressions for given relations by querying entity pairs linked with the relations from a corpus. A relation corresponding to an edge is modeled as a collection of frequently appeared expressions. In the experiment, automatically collected expressions are applied to a NLI and the NLI showed comparable results with manually approaches.