음절 발화속도 보상을 이용한 한국어 연속음 음성인식 성능향상

  • Jung Hyun Lee

초록

음성인식 시스템의 인식률은 배경잡음이나 화자의 성별, 억양, 발화속도 변화 등의 화자 변이성에 크게 영향을 받는다. 특히 실질적인 연속음 음성인식 과정에서 화자간의 발화속도 변화나 동일 화자내의 발화속도 변는 오인식의 주요 원인이 된다. 본 논문은 이와 같은 발화속도의 변화에 따른 오인식률을 줄이기 위해 평균 음절 발화속도와 어절 내 음절의 비율을 적용한 발화속도 보상 방법을 제안한다. 먼ㅓ 기준 발화속도와입력된 어절 발화속도의 비율정보를 이용하여 어절 내에서 추출할 새로운 특징 벡터열 개수를 구성한다. 구성된 특징 벡터열 개수는 어절 내 각 음절 길이에 맞게 구간별로 분할된다. 분할된 음절 구간별 특징 벡터열은 발화속도와 음절길이에 맞게 최적화되었으므로 특징 추출시 발화속도 변화에 따른 음성인식 성능저하를 개선할 수 있다. 본 논문에서 제안한 발화속도 보상 알고리즘을 연속음 음성인식 엔진에 적용하여 실험한 결과,향상된 결과를 얻었다.

제목
음절 발화속도 보상을 이용한 한국어 연속음 음성인식 성능향상
저자
Jung Hyun Lee
학회명
한국음향학회