- 은닉변수를 이용한 Latent One-Class SVM
- ㆍ 저자명
- 이창기,Lee. Changki
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2013년|40권 8호|pp.429-434 (6 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
One-class SVM은 데이터가 존재하는 영역을 추출하고, 이 영역을 서포트 벡터로 표현하며 표현된 영역 밖의 데이터들은 아웃라이어(outlier)로 간주된다. 본 논문에서는 데이터 포인트마다 은닉 변수(hidden variable) 혹은 토픽(topic)이 있다고 가정하고, 이를 반영하기 위해 PoMEN에 기반을 둔 Latent One-class SVM을 제안한다. Latent One-class SVM은 베이지안 형태의 학습과 max-margin 형태 학습이 결합된 것으로 학습을 위해 EM 알고리즘과 유사한 학습 알고리즘을 사용하며 내부적으로 기존의 One-class SVM의 학습 알고리즘을 서브루틴으로 사용한다. 실험결과 Latent One-class SVM이 대부분의 구간에서 One-class SVM 보다 성능이 높았으며, 특히 거짓 긍정률이 낮고 참 긍정률이 낮지 않은 구간에서 더욱 효과적임을 알 수 있었다.
One-class SVM estimates the region in the input space where the sample reside. One-class SVM uses only positive examples in training. In this paper, we present a latent one-class SVM that attempts to combine the advantages of Baysian-style learning and max-margin learning. The latent one-class SVM leads to an averaging prediction rule that resembles a Bayes predictor. We develop an EM-style algorithm utilizing existing convex optimization algorithm for a standard one-class SVM as a subroutine. We show that the latent one-class SVM outperforms a standard one-class SVM on real world OCR and URL data set.