- 데이터마이닝 기술을 이용한 한국과학기술인용색인DB 활용 방안 연구
- ㆍ 저자명
- 박종현,최선희,김병규,Park. Jong-Hyun,Choi. Seon-Heui,Kim. Byung-Kyu
- ㆍ 간행물명
- 정보관리연구
- ㆍ 권/호정보
- 2012년|43권 4호|pp.191-210 (20 pages)
- ㆍ 발행정보
- 한국과학기술정보연구원
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
한국과학기술정보연구원(KISTI)에서는 대량의 학술 정보들을 분류하여 저장하고 관리하기 위한 한국과학기술 인용색인 데이터베이스(KSCD)를 구축한 바 있다. 그러나 학술인용색인데이터들은 그 특성상 단순히 저장만을 위한 자료가 아니다. 즉, 저장된 데이터를 기반으로 사용자들에게 어떠한 서비스를 어떻게 제공할 것인지는 KSCD의 활용 측면에서 매우 중요한 문제이다. 예를 들어 사용자는 단순히 특정 저자가 기술한 학술 자료들을 검색하기를 원할 수도 있지만, 필요에 따라 해당 저자와 유사한 연구를 수행하는 저자들을 검색하기를 원할 것이다. 그러나 단순히 저장된 데이터만으로 이러한 서비스를 제공하기는 어렵다. 그러므로 본 논문에서는 한국과학기술인용색인 데이터베이스(KSCD)를 향후 어떻게 활용할 수 있는가에 대한 해답을 찾기 위해서는 국내외에서 현재 어떠한 서비스들을 제공하고 있는지 살펴보고 이와 관련하여 어떤 방향으로 연구가 진행해야 하는지를 모색한다. 특별히 데이터 마이닝 기술은 다양한 형태의 데이터로부터 데이터 속에 내포되어있는 특징(Feature)들을 추출하고 새로운 데이터 모델을 발견하여 의미 있는 정보를 추출해 내어 결국은 사용자의 의사 결정에 도움을 주는 것을 그 목적으로 한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 유용한 정보를 발견해 내는 것이다. 그러므로 본 논문에서는 이러한 데이터마이닝 기법을 학술인용색인데이터에 적용하여 제공할 수 있는 서비스들이 무엇이 있는지 논의한다.
Scholarly science citation data is typically of large volume and consists of a variety of data. Moreover, the volume of data is increasing more and more. Therefore, there are some requirements to store and manage the data efficiently and Korea Institute of Science and Technology Information (KISTI) develops Korea Science Citation Database (KSCD) which manage and serve very large-volume of korea science technique information including citation data. However, current services based on KSCD are not enough for various users. Thus, it is important issue to offer a variety of services using KSCD. For example, if a user searches articles described by a specific author, then a user may want to find not only the articles cited by a certain author but also those articles that study similar topics. However, it is not always easy to provide these services with citation data. Therefore, this paper surveys studies about services using citation data in order to find approaches for better utilizing KSCD. Especially, this paper considers data mining techniques, because data mining is one of the main techniques to extracting semantic information from big data. Therefore, this paper discusses methods for utilizing large volume of KSCD based on data mining technique.