- 간판 영상 인식을 위한 텍스트 영역 왜곡 보정
- ㆍ 저자명
- 임준식,김수형,박상철,Lim. Jun-Sik,Kim. Soo-Hyung,Park. Sang-Cheol
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용
- ㆍ 권/호정보
- 2011년|38권 9호|pp.470-476 (7 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
자연 영상에서 촬영된 간판 영상은 촬영 각도에 따라 선형 왜곡이 발생하고 이는 간판 영상내의 텍스트 인식의 성능 저하의 원인이 된다. 본 논문에서는 자연 영상에서 촬영된 간판 영상의 인식 성능을 향상시키기 위한 전처리 기법으로 영상 왜곡 보정 방법을 제안한다. 제안 방법은 간판 영상에 포함된 텍스트의 수직 성분 분석을 통해 왜곡된 정도를 계산하여 텍스트 영역의 외곽선을 추정하고 추정된 외곽선을 기반으로 양선형 변환(Bilinear Transformation)을 이용하여 텍스트 영상의 왜곡을 보정 한다. 제안한 방법의 성능을 평가하기 위해 두 가지 실험을 하였다. 첫째, 일정한 왜곡을 적용한 가상 데이터에 대하여 제안 방법을 적용하여 복원된 영상과 원영상의 유사도를 비교하였다. 둘째, 스마트폰을 이용해 수집된 간판 영상에 대하여 원영상과 제안한 방법으로 왜곡을 보정한 영상을 각각 인식하여 그 결과를 비교하였다. 인식기는 상용 인식기인 아르미 6.5 pro를 사용하였다. 실험결과 가상 데이터에 대하여 원영상과 왜곡 보정된 두 영상간에 95.61%의 유사도를 보였다. 그리고, 왜곡을 보정한 실제 간판 영상의 인식 결과는 원영상을 인식한 결과보다 문자 단위에서 41.19%, 전체 텍스트 단위에서 62.86% 향상되었다. 이로부터 제안 방법이 왜곡된 영상을 보정하는데 효율적임을 입증하였다.
Linear distortion of the text region in signboard images appears according to the photographing angle of the images and result in a reduction of the accuracy of character recognition. In this paper, we propose a method to correct the linear distortion of text regions as one of preprocessing steps. The proposed method estimates the outline of text region based on calculating the degree of the distortion by analyzing the slops of the vertical lines of characters in text regions. Then, the method corrects the distortion by a bilinear transformation to the outline of text area. The experimental results show that the similarity between artificial images and distortion-corrected images was 95.61% and the recognition rates in character and text level using the real signboard images with distortion correction is higher by 41.19% and 62.86%, respectively. In summary, the proposed method is effective to correct the linear distortion of text regions on signboard images.