상세 보기
음성언어 감정 인식을 위한 시계열 특징추출 및 다양한 순환신경망 모델의 성능비교
Time Series Feature Extraction and Performance Comparison of Recurrent Neural Network Models for Speech Emotion Recognition
초록
인간의 주 의사 소통 방법인 목소리를 통한 음성 언어는 단순한 언어 정보의 전달만이 아니라 음성의 억양과 높낮이 그리고 주변 환경 등 여러가지 특징을 통해 감정 정보를 함께 전달하게 된다. 현재 많은 연구들이 인간과 컴퓨터의 상호작용을 위해 음성언어기반의 감정을 시스템이 파악하는데 초점을 맞추고 있으며, 음성의 다양한 주파수 특성을 추출하여 신경망모델을 개발하고 있다. 본 논문은 시간에 따른 감정 변화를 정확하게 인식하기 위해, 시간 영역에서 시계열 데이터 전처리와 3 가지 음성 신호 기반의 자연어 특징 추출을 진행한다. 제안하는 데이터 전처리, 특징 추출 방법은 주파수 영역의 특징으로만 비교하는 학습 방식보다 시간에 따라 변화하는 자연어 및 복잡한 감정인식에 유리하다. 2개의 공개 데이터 셋을 이용하여 시계열 특징을 입력으로 하는 순환 신경망 모델 알고리즘들을 개발하고 이들의 성능을 비교하였다.
- 제목
- 음성언어 감정 인식을 위한 시계열 특징추출 및 다양한 순환신경망 모델의 성능비교
- 제목 (타언어)
- Time Series Feature Extraction and Performance Comparison of Recurrent Neural Network Models for Speech Emotion Recognition
- 저자
- KIM DEOKHWAN
- 학회명
- 2022 한국차세대컴퓨팅학회 춘계 학술대회
- 개최지
- 베스트웨스턴제주호텔
- 학회 개최일
- 2022-05-19 ~ 2022-05-21