음악 장르 분류를 위한 데이터 생성 및 머신러닝 적용 방안

엄빛찬; 조동휘; 남춘성

상세 보기

음악 장르 분류를 위한 데이터 생성 및 머신러닝 적용 방안

Generating Data and Applying Machine Learning Methods for Music Genre Classification

엄빛찬;
조동휘;
남춘성

초록

본 논문은 머신러닝을 활용하여 많은 양의 음악 데이터를 분류하여 장르 정보가 입력되어 있지 않은 음악 장르 분류 정확도 향상을 목표로 한다. 음악의 장르를 구분하기 위해 기존 연구에서 많이 사용되던 GTZAN 데이터 세트 대신 직접 데이터를 수집하고 전처리하는 방안을 제시한다. 이를 위해 GTZAN 데이터 세트보다 분류 성능이 뛰어난 데이터 세트를 생성하기 위해 Onset의 에너지 레벨이 가장 높은 일정 구간을 추출한다. 학습에 사용하는 음악 데이터의 주요 특성으로는 Mel Frequency Cepstral Coefficient(MFCC)를 포함한 57개의 특성을 이용한다. 전처리된 데이터를 통해 Support Vector Machine(SVM) 모델을 이용하여 Blues, Classical, Jazz, Country, Disco, Pop, Rock, Metal, Hiphop으로 분류한 학습 정확도가 85%를 기록하였고, 테스트 정확도가 71%를 보여주었다.

키워드

음악 장르 분류; 머신러닝; 음악 특징 추출; GTZAN; 서포트 벡터 머신; Music genre classification; Machine Learning; Music feature extraction; GTZAN; Support vector machine

제목: 음악 장르 분류를 위한 데이터 생성 및 머신러닝 적용 방안

제목 (타언어): Generating Data and Applying Machine Learning Methods for Music Genre Classification

저자: 엄빛찬; 조동휘; 남춘성

발행일: 2024-08

유형: Y

저널명: 인터넷정보학회논문지

권: 25

호: 4

페이지: 57 ~ 64