기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
교환연산을 포함한 확장편집거리 병렬계산
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 교환연산을 포함한 확장편집거리 병렬계산
저자명
강대웅,김영호,심정섭,Kang. Dae Woong,Kim. Youngho,Sim. Jeong Seop
간행물명
정보과학회논문지. Journal of KIISE. 시스템 및 이론
권/호정보
2014년|41권 4호|pp.175-181 (7 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

근사문자열매칭 문제는 컴퓨터보안, 검색엔진, 생물정보학과 같은 다양한 분야에서 연구되고 있다. 근사문자열매칭에서는 불일치 정도를 판단하기 위해, 편집거리나 확장편집거리와 같은 거리함수를 이용한다. 알파벳 ${sum}$의 문자들로 구성된, 길이가 각각 m, n인 두 문자열 X, Y의 편집거리는 X를 Y로 변환하기 위해 필요한 최소 편집연산의 수로 정의된다. 이 때 편집연산은 삽입, 삭제, 교체연산으로 구성된다. X, Y의 확장편집거리는 X를 Y로 변환하기 위해 필요한 최소 확장편집연산의 수로 정의된다. 이때, 확장편집연산은 편집연산에 교환연산을 추가한 연산들로 구성된다. X, Y의 확장편집거리는 동적프로그래밍 기법을 이용하여 O(mn) 시간과 공간을 이용하여 계산할 수 있다. 본 논문에서는 X, Y의 확장편집거리를 최대 m개의 쓰레드를 이용하여 O(m+n) 시간과 O(mn) 공간을 이용하여 계산하는 병렬알고리즘을 제시한다. 또한 확장편집거리를 계산하는 순차알고리즘과 병렬알고리즘을 각각 CPU와 GPU 기반으로 구현하여 두 알고리즘의 수행시간을 비교한다. 실험 결과 두 문자열의 길이가 각각 10,000일 때, 병렬알고리즘이 순차알고리즘에 비하여 약 16배 빠른 수행시간을 보였다.

기타언어초록

Approximate string matching problems have been studied in such diverse fields as computer security, search engines, and bioinformatics. To measure the amounts of errors between two strings, approximate string matching uses distance functions such as the edit distance and the extended edit distance. Given two strings X and Y (${mid}X{mid}=m$, ${mid}Y{mid}=n$) over an alphabet ${sum}$, the edit distance between X and Y is the minimum number of edit operations to convert X into Y. Edit operations consist of insertions, deletions and changes. The extended edit distance between X and Y is the minimum number of extended edit operations to convert X into Y. Extended edit operations consist of insertions, deletions, changes, and swaps. The edit distance and the extended edit distance between X and Y can be computed using dynamic programming technique in O(mn) time and space. In this paper, we present a parallel algorithm of computing the extended edit distance between two strings. Our algorithm computes the extended edit distance between X and Y in O(m+n) time using m threads where $m{leq}n$. We implemented our parallel algorithm using CUDA. The experimental results show that our algorithm runs about 16 times faster than the sequential algorithm when m = n = 10,000.