기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
범주형 데이터 분석에서 속성의 영향력을 이용한 군집분석
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 범주형 데이터 분석에서 속성의 영향력을 이용한 군집분석
저자명
오수민,송준모,김철수,Oh. Su Min,Song. Jun Mo,Kim. Chul Soo
간행물명
정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
권/호정보
2012년|18권 11호|pp.790-793 (4 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

데이터마이닝의 다양한 기법들 중에서 군집분석 방법은 객체간의 유사도를 이용하여 비슷한 객체끼리 군집화하는 방법이다. 수치형 데이터에 대한 군집분석 방법은 k-means 알고리즘[1]이 잘 알려져 있으며, 범주형 데이터에 대한 군집분석방법은 k-modes 알고리즘[2]이 알려져 있다. 본 논문에서는 범주속성의 데이터에 대하여 속성의 영향력을 수치적으로 평가하여 이를 군집화에 적용하였다. 군집화 기법에는 두 가지 방법을 이용하였다. 먼저 데이터의 분할에는 Tree-based Method[3-5]를 이용하여 영향력 높은 속성에 따른 속성 수준으로 데이터를 구분하였으며, 이를 k-modes 알고리즘을 이용하여 군집화 하였다. 각각의 방법은 범주형 속성에 대하여 속성의 영향력을 적용할 수 있도록 적용하였으며 높은 정확도를 보여주었다.

기타언어초록

Clustering analysis method is a method of assigning a set of objects into the clusters so that the objects in the same cluster are more similar to each other clusters. Especially, k-means algorithms is the most famous clustering in numerical data and k-modes algorithms is clustering algorithm in categorical data. In this paper, we used two algorithms that Tree-based Methods and k-modes algorithms. Each gives rise to and supports the other, while the entire process is cluster analysis using a frequency of categorical data attributes.