선형워핑함수의 화자정규화에 의한 음성인식시스템의 성능향상

Jung Hyun Lee

상세 보기

선형워핑함수의 화자정규화에 의한 음성인식시스템의 성능향상

Performance implementation of Speech Recognition System Based on Speaker Nomalization through Linear Warping Function

Jung Hyun Lee

초록

화자종속 음성인식 시스템은 훈련 데이터가 화자들 사이의 음향적 변이를 충분히 모델링할 수 있을 때, 화자독립 시스템보다 더 성능이 좋은 것으로 알려져 있다. 화자 정규화 기술은 입력음성의 스펙트럼을 수정하여 화자들 사이의 변이를 줄인다. 최근 성공적인 알고리즘은 신호처리 단계에 화자 특유 주파수 워핑을 통합했다. 이런 알고리즘은 입력음성에 담겨있는 음향적 특징을 다 사용하지 않는다. 본 논문에서는 화자의 음향적 특징으로 세개의 포만트를 이용하였고, 수집된 포만트 주파수들로부터 워핑함수를 정의하는데 선형회귀를 사용한 화자 정규화를 제안한다. 이 방법을 사용하여 인식 성능을 향상할 수 있었다.

제목: 선형워핑함수의 화자정규화에 의한 음성인식시스템의 성능향상

제목 (타언어): Performance implementation of Speech Recognition System Based on Speaker Nomalization through Linear Warping Function

저자: Jung Hyun Lee

학회명: 한국정보처리학회 추계학술발표논문집