- 변동성 지표 값의 그룹화에 기반한 한국어 파찰음 인식
- ㆍ 저자명
- 이재원,Lee. Jae-Won
- ㆍ 간행물명
- 정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
- ㆍ 권/호정보
- 2013년|19권 10호|pp.495-501 (7 pages)
- ㆍ 발행정보
- 한국정보과학회
- ㆍ 파일정보
- 정기간행물| PDF텍스트
- ㆍ 주제분야
- 기타
스마트폰의 급속한 보급에 따라, 최근 모바일 환경에서 작동 가능한 음성 인식 시스템에 대한 수요가 급격히 증대되고 있다. 본 논문은 음소 기반 한국어 음성 인식 시스템에 적용하기 위한 새로운 한국어 파찰음 인식 방안을 제안한다. 제안하는 방식은 입력 음성 신호를 구성하는 각각의 블록에 대해 계산되는 변동성 지표 값에 기반하며, 이들 지표 값을 그룹화하는 두 가지 파찰음 인식 기법이 제시된다. 그 중 하나는 매우 높은 변동성을 보이는 연속적인 블록들을 탐지하는 것이고, 다른 하나는 짧은 구간에 걸쳐 나타나는 변동성의 급격한 변화를 탐지하는 것이다. 이 두 가지 기법을 결합하여 파찰음이 인식된 위치를 최종적으로 결정한다. 실험 결과를 통해, 제안하는 방식을 사용함으로서 기존의 영교차율 기법에 비해 FRR과 FAR의 관점에서 모두 오류율을 현저히 감소시킬 수 있음을 확인하였다.
With the rapid spread of smart phones, the demand for speech recognition systems available in mobile environments nowadays is increasing rapidly. This paper proposes a novel method for Korean affricate recognition which is applicable to a phoneme based Korean speech recognition system. The proposed method is based on the volatility indicator values calculated for each constituting block of the input speech signal. Two methods for grouping the volatility indicator values for recognizing affricates are introduced. One is to detect successive blocks of very high volatilities and the other is to detect rapid variations on volatilities over several blocks. By combining these two methods, the positions at which the affricates are recognized are finally determined. According to the experimental results, it is shown that the proposed method can markedly reduce the error rate that the existing zero crossing rate method generates in terms of both the false reject rate and false accept rate.