- NSGA-II 알고리즘을 이용한 다중 레이블 분류 문제에서 특징 선별
- ㆍ 저자명
- 윤정훈,이재성,김대원,Yoon. Jeonghun,Lee. Jaesung,Kim. Dae-Won
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2013년|40권 3호|pp.133-140 (8 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
최근 하나 이상의 클래스 레이블을 가지는 데이터에 대한 클래스 분류 기법들이 연구되고 있다. 그 중 몇몇 연구들에서 다중 레이블 분류의 성능을 높이기 위해 특징 선별 기법을 사용했다. 그러나 다중 레이블 데이터의 복잡성으로 인해 기존의 특징 선별 기법을 적용하는 것은 성능 향상에 한계가 있다. 본 논문은 다목적 최적화 알고리즘인 NSGA-II를 다중 레이블 특징 선별 문제에 활용했다. 또한 본 논문에서는 특징 선별 문제에 적합한 유전자 조작 기법을 제안하여 NSGA-II에 적용했다. 그리고 실제 다중 레이블 데이터 셋에서 실험을 통해 제안하는 알고리즘이 기존 유전자 알고리즘을 사용한 특징 선별 기법보다 더 좋은 성능을 가지는 것을 보인다.
Recently, a lot of researchers are interested in multi-label classification. Some of the researchers use feature subset selection to improve performance in multi-label classification. However, because multi-label problem is more complex than single-label, single-label feature selection algorithms have limitation to be applied to multi-label data. In this paper, NSGA-II, which is multi-objective optimize algorithm, is used for multi-label feature selection. In addition, this study proposes a novel genetic operator for feature selection problem. Finally, experiments on real world data set show that proposed algorithm achieves better performance than traditional genetic algorithm.