음악 장르 분류를 위한 데이터 생성 및 머신러닝 적용 방안

Generating Data and Applying Machine Learning Methods for Music Genre Classification

초록

본 논문은 머신러닝을 활용하여 많은 양의 음악 데이터를 분류하여 장르 정보가 입력되어 있지 않은 음악 장르 분류 정확도 향상을 목표로 한다. 음악의 장르를 구분하기 위해 기존 연구에서 많이 사용되던 GTZAN 데이터 세트 대신 직접 데이터를 수집하고 전처리하는 방안을 제시한다. 이를 위해 GTZAN 데이터 세트보다 분류 성능이 뛰어난 데이터 세트를 생성하기 위해 Onset의 에너지 레벨이 가장 높은 일정 구간을 추출한다. 학습에 사용하는 음악 데이터의 주요 특성으로는 Mel Frequency Cepstral Coefficient(MFCC)를 포함한 57개의 특성을 이용한다. 전처리된 데이터를 통해 Support Vector Machine(SVM) 모델을 이용하여 Blues, Classical, Jazz, Country, Disco, Pop, Rock, Metal, Hiphop으로 분류한 학습 정확도가 85%를 기록하였고, 테스트 정확도가 71%를 보여주었다.

키워드

음악 장르 분류머신러닝음악 특징 추출GTZAN서포트 벡터 머신Music genre classificationMachine LearningMusic feature extractionGTZANSupport vector machine
제목
음악 장르 분류를 위한 데이터 생성 및 머신러닝 적용 방안
제목 (타언어)
Generating Data and Applying Machine Learning Methods for Music Genre Classification
저자
엄빛찬조동휘남춘성
발행일
2024-08
유형
Y
저널명
인터넷정보학회논문지
25
4
페이지
57 ~ 64