자료유형
-
버로우즈-휠러 변환을 이용한 런-길이 문자열의 효율적인 색인 기법
김성환, 조환규, Kim. Sung-Hwan, Cho. Hwan-Gue 한국정보과학회 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터 5 Pages
한국정보과학회 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터 2014, Vol.20 No.1 26-30 (5 pages)
문자열 매칭은 긴 문자열 상에서 짧은 패턴 문자열의 출현 위치를 찾는 문제이다. 특히 탐색 대상이 되는 문자열이 고정된 경우에는 이를 색인하여 다수의 패턴 문자열에 대한 질의를 효율적으로 처리할 수 있다. 본 논문에서는 색인된 문자열 매칭 문제에 있어서 탐색 대상 문자열과 패턴 문자열이 모두 런-길이(run-length) 인코딩된 형태로 입력되는 경우를 다루고자 한다. 제안하는 기법은 버로우즈-휠러 변환을 이용하여 문자열을 색인하고, 탐색 대상인 텍스트 문자열의 서로 다른 런의 수가 ${sigma}$, 텍스트 문자열과 패턴... -
버로우즈-휠러 변환과 다단계 정렬을 이용한 고속 한글 문서 탐색 기법
박선영, 조환규, Park. Sun-Young, Cho. Hwan-Gue 한국정보과학회 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 15 Pages
한국정보과학회 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 2012, Vol.39 No.11 912-926 (15 pages)
생성하고 저장하기 위하여 버로우즈-휠러 변환(Burrows-Wheeler Transform, BWT)을 사용하며, 유사 영역을 사용자 선택적으로 찾기 위하여 다단계 정렬(Multi-Level Alignment, MLA) 이라는 방법을 활용한다. 또한 원문을 보호하기 위하여 손실 압축의 일종인 한글 스킨 추출을 사용한다. 실험 결과 제안한 모델을 통해 원문을 매우 효과적으로 보호하면서, 20자 이상의 검색어에 대해서는 매우 정확하게 검색을 수행함을 알 수 있었다. 또한 다단계 정렬을 통해 사용자가 속도와 검색 민감도를 적절히 조정하면서 유사 영역을 탐색할 수... -
확장된 버로우즈-휠러 변환을 이용한 개선된 한글 초성 탐색
김성환, 조환규, Kim. Sung-Hwan, Cho. Hwan-Gue 한국정보과학회 정보과학회. 컴퓨팅의 실제 논문지 6 Pages
한국정보과학회 정보과학회. 컴퓨팅의 실제 논문지 2014, Vol.20 No.12 682-687 (6 pages)
한글 초성 질의는 내비게이션 시스템이나 모바일 기기와 같이 입력 환경에 제약이 있어 오류가 빈번한 인터페이스 상에서 사용자 편의성 향상을 위하여 제공되는 중요한 기능이다. 본 논문에서는 한글 문자열을 자소 단위로 분해하여 재배열하여 환형 문자열로 변환한 후, 확장된 버로우즈-휠러 변환을 이용하여 색인함으로써 초성 질의 탐색을 위한 시공간 효율적인 자료구조를 제안한다. 또한 실험을 통하여 기존 기법에 비하여 더 적은 공간만을 사용하면서도 보다 다양한 형태의 질의를 처리할 수 있으며, 특히 질의어의 길이가 짧고,... -
Identification of Two Novel Amalgaviruses in the Common Eelgrass (Zostera marina) and in Silico Analysis of the Amalgavirus +1 Programmed Ribosomal Frameshifting Sites
한국식물병리학회 The Plant Pathology Journal 7 Pages
한국식물병리학회 The Plant Pathology Journal 2018, 34권 2호 9 150-156 (7 pages)
The genome sequences of two novel monopartite RNA viruses were identified in a common eelgrass (Zostera marina) transcriptome dataset. Sequence comparison and phylogenetic analyses revealed that these two novel viruses belong to the genus Amalgavirus in the family Amalgaviridae. They were named Zostera marina amalgavirus 1 (ZmAV1) and Zostera marina amalgavirus 2 (ZmAV2). Genomes of both ZmAV1 and ZmAV2 contain two overlapping open reading frames (ORFs). ORF1 encodes a putative replication... -
De novo Genome Assembly and Single Nucleotide Variations for Soybean Mosaic Virus Using Soybean Seed Transcriptome Data
한국식물병리학회 The Plant Pathology Journal 10 Pages
한국식물병리학회 The Plant Pathology Journal 2017, 33권 5호 5 478-487 (10 pages)
Soybean is the most important legume crop in the world. Several diseases in soybean lead to serious yield losses in major soybean-producing countries. Moreover, soybean can be infected by diverse viruses. Recently, we carried out a large-scale screening to identify viruses infecting soybean using available soybean transcriptome data. Of the screened transcriptomes, a soybean transcriptome for soybean seed development analysis contains several virus-associated sequences. In this study, we... -
차세대 시퀀싱을 위한 짧은 서열 정렬에 대한 기술조사
박민서, 김판규, Park. Min-Seo, Kim. Pan-Gyu 한국정보과학회 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 9 Pages
한국정보과학회 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 2011, Vol.38 No.10 503-511 (9 pages)
방식을 통해서 생산되는 단편서열들은 Sanger시퀀싱을 통해서 생산되는 서열에 비해서 그 길이가 짧고, 대량의 단편서열용 사용하기 때문에, 서열 재조합시 참조 서열을 이용한 맵핑이 활용된다. 다량의 짧은 서열의 빠른 처리를 위해 인덱싱 기반의 휴리스틱 알고리즘들이 개발되어 사용되고 있다. 이러한 방법으로는 해쉬 테이블에 기반한 방법, 접미사 트리에 기반한 방법, 접미사 배열의 변형된 형태인 Burrows-Wheeler transform에 기반한 방법이 있다. 이 논문에서는 현재 개발된 서열 정렬 알고리즘들을 살펴보고, 다양한 차세대... -
대역분할과 GAP를 이용한 BWT기반의 무손실 영상 압축
윤정오, 고승권, 성우석, 황찬식 한국통신학회 한국통신학회논문지. The Journal of Korea Information and Communications Society. 네트워크 및 서비스 8 Pages
한국통신학회 한국통신학회논문지. The Journal of Korea Information and Communications Society. 네트워크 및 서비스 2001, Vol.26 1259-1266 (8 pages)
Burrows-Wheeler Transform)이 소개되었다. 그러나 영상 압축에 BW변환을 직접 적용하면 영상과 텍스트가 갖는 상관성이 서로 다르기 때문에 만족할 만한 압축효과를 기대할 수 없게 된다. 따라서 본 논문에서는 가역의 L-SSKF(Lossless Symmetric Short Kernel Filter)를 사용한 계층적 대역분할로 영상화소 사이의 상관성을 줄인 후 BW변환을 하는 방법과 GAP(Gradient Adjusted Prediction)를 사용하여 LL 대역에 많이 분포된 상관성을 줄인 후 BW변환을 하는 방법을 제안한다. 실험결과 제안한 방법이 기존의 무손실 JPEG 표준안과 LZ... -
대용량 한글 문서의 원문 보호 탐색 기법
박선영, 김성환, 조환규, Park. Sun-Young, Kim. Sung-Hwan, Cho. Hwan-Gue 한국정보과학회 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터 5 Pages
한국정보과학회 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터 2012, Vol.18 No.7 563-567 (5 pages)
보관하는 것을 보장한다면, 저작권자들이 데이터를 제공하는 데에 드는 거부감을 완화할 수 있을 것이다. 본 논문에서는 초성을 이용한 한글 스킨 추출 방법을 이용한 원문 보호가 이루어지면서 특정 단어나 문장이 존재하는지 탐색할 수 있는 시스템을 제안한다. 제안하는 시스템은 한글 문서의 초성을 추출하고, 버로우즈-휠러 변환(Burrows-Wheeler Transformation)을 수행하여 접미사 배열 정보와 원문 정보를 최소한의 용량으로 저장한다. 실험 결과 20자 이상의 문장에 대하여 신속하고 정확한 검색이 가능함을 보였다. 또한...


전체 선택해제

총


