음성언어 감정 인식을 위한 시계열 특징추출 및 다양한 순환신경망  모델의 성능비교

KIM DEOKHWAN

상세 보기

음성언어 감정 인식을 위한 시계열 특징추출 및 다양한 순환신경망 모델의 성능비교

Time Series Feature Extraction and Performance Comparison of Recurrent Neural Network Models for Speech Emotion Recognition

KIM DEOKHWAN

초록

인간의 주 의사 소통 방법인 목소리를 통한 음성 언어는 단순한 언어 정보의 전달만이 아니라 음성의 억양과 높낮이 그리고 주변 환경 등 여러가지 특징을 통해 감정 정보를 함께 전달하게 된다. 현재 많은 연구들이 인간과 컴퓨터의 상호작용을 위해 음성언어기반의 감정을 시스템이 파악하는데 초점을 맞추고 있으며, 음성의 다양한 주파수 특성을 추출하여 신경망모델을 개발하고 있다. 본 논문은 시간에 따른 감정 변화를 정확하게 인식하기 위해, 시간 영역에서 시계열 데이터 전처리와 3 가지 음성 신호 기반의 자연어 특징 추출을 진행한다. 제안하는 데이터 전처리, 특징 추출 방법은 주파수 영역의 특징으로만 비교하는 학습 방식보다 시간에 따라 변화하는 자연어 및 복잡한 감정인식에 유리하다. 2개의 공개 데이터 셋을 이용하여 시계열 특징을 입력으로 하는 순환 신경망 모델 알고리즘들을 개발하고 이들의 성능을 비교하였다.

제목: 음성언어 감정 인식을 위한 시계열 특징추출 및 다양한 순환신경망 모델의 성능비교

제목 (타언어): Time Series Feature Extraction and Performance Comparison of Recurrent Neural Network Models for Speech Emotion Recognition

저자: KIM DEOKHWAN

학회명: 2022 한국차세대컴퓨팅학회 춘계 학술대회

개최지: 베스트웨스턴제주호텔

학회 개최일: 2022-05-19 ~ 2022-05-21