상세 보기
초록
현대 사회에서 데이터가 복잡해지고 방대해지면서 특징 선택 기법에 대한 연구가 활발히 진행되고 있다, 기존의 연구에서는 모델에 상관없이 같은 결과가 나오는 모델 독립적인 특징선택 기법과 선택된 모델에 대해 정확도를 최대화할 수 있는 모델 의존적인 특징 선택 기법중 한 가지만 적용을 시켜 시스템의 전체적인 성능이 하락하거나 만들고자 하는 시스템에가장 최적화된 특징을 선택하기 힘들다는 문제가 있다. 본 연구에서는 하이퍼 파라미터 최적화 기법인 Grid Search와 Random Search를 통해 수식을 형성하여 중요도 인자를 도출함으로써 모델 독립적인 방법과 모델 의존적인 방법을 양쪽의 장점을 모두 가질 수 있도록 결합하는 새로운 특징 선택 기법을 제안한다. 머신러닝에 자주 사용되는 Sonar data set과WPBC data set을 이용하여 제안된 구조에 대한 성능 평가를 진행한 결과 기존의 한 가지방법만 사용하였을 경우에 비해 최고 16%의 성능 향상을 보여 제안된 방법의 효과성을 증명한다.
키워드
Machine learning; Feature selection; Pearson correlation coefficient; Input sensitivity; Hyper-parameter Optimization; 기계학습; 특징 선택 기법; 피어슨 상관계수; 입력 민감도; 하이퍼파라미터 최적화
- 제목
- 모델 독립적 방법과 모델 의존적 방법의 결합을 통한 기계학습 기반 특징 선택 기법
- 제목 (타언어)
- Machine-learning based feature selection by combining model independent and dependent method
- 저자
- 이정수; 이종식; 강상길
- 발행일
- 2023-04
- 유형
- Y
- 저널명
- 한국지능시스템학회 논문지
- 권
- 33
- 호
- 2
- 페이지
- 154 ~ 161