포만트 주파수를 이용한 음성인식 전처리 시스템의 설계 및 구현

A Design and Implementation of Speech Recognition Preprocessing System using Formant Frequency
  • Jung Hyun Lee

초록

인간이 발성하는 음성에는 의미에 대한 정보뿐만 아니라 화자의 성별에 따라 고유한 특성을 가지고 있다. 즉 음성은 고음이 가아ㅎㄴ 여성음성과 저음이 강한 남성음성으로 분류할 수 있다. 그러나, 기존의 HMM을 이용한 음성인식시스템에서는 남성과 여성의 이러한 특성이 있음에도 불구하고 이를 고려하지 않고, 하나의 HMM으로 구성하고 있다. 본 논문에서 제시하는 알고리즘으로 실험한 결과 남성과 여성의 포만트 주파수가 100-300Hz차이가 나는 것을 알 수 있었고, 이러한 특성을 고려하여 남성과 여성의 음성을 구별할 수 있는 방법을 제안한다. 또한 남성과 여성음성을 각각 구분하여 HMM을 훈련시킨 후 인식과정에서 입력된 음성의 포만트 특성에 따라 남성음성이면 남성HMM으로여성음성이면 여성HMM으로 인식을 수행함으로써 기존의 인식방법보다 남성음성은 5.2% 여성음성은 4.4% 향상된 결과를 얻었다.

제목
포만트 주파수를 이용한 음성인식 전처리 시스템의 설계 및 구현
제목 (타언어)
A Design and Implementation of Speech Recognition Preprocessing System using Formant Frequency
저자
Jung Hyun Lee
학회명
한국정보과학회 가을 학술발표논문집