상세 보기
제조 공정 데이터에서 리샘플링과 특성 선택 기법의 효과적 조합: 성능 최적화를 위한 실험적 접근
Effective Combination of Resampling and Feature Selection Techniques in Manufacturing Process Data: An experimental approach to performance optimization
- 한기수;
- 정현철;
- 김정은
초록
제조 산업에서 데이터 기반 의사결정은 고차원 데이터와 클래스 불균형 문제로 인해 공정 최적화의 효율성이 저하될 수 있으며, 효과적인 데이터 활용을 위해 두 가지 문제를 동시에 해결할 수 있는 통합적인 전처리 방법이 필요하다. 본 논문에서는 고차원성과 클래스 불균형 문제를 해결하기 위해 다양한 특성 선택 알고리즘과 리샘플링 기법을 결합하여 성능을 비교하고, 최적의 데이터 전처리 전략을 실험적으로 분석한다. 5개의 제조 공정 데이터 셋을 대상으로 3개의 리샘플링 기법, 6개의 특성 선택 알고리즘, 5개의 분류기를 조합하여 실험한 결과, 각 데이터 셋 및 분류기에 따른 최적 구성은 다소 상이했지만, 전체적으로 RandomForest 분류기와 SMOTE 리샘플링 및 T-test 특성 선택을 결합한 조합이 가장 우수한 성능을 보였다. 세부 실험에서는 리샘플링과 특성 선택의 적용 순서에 따라 유의미한 성능 차이가 나타났으며, 이는 전처리 과정에서 적용 순서도 중요한 요소임을 의미한다.
키워드
Manufacturing Process; Classification; High Dimensionality; Class Imbalance; Feature Selection; Resampling; 제조 공정; 분류; 고차원성; 클래스 불균형; 특성 선택; 리샘플링
- 제목
- 제조 공정 데이터에서 리샘플링과 특성 선택 기법의 효과적 조합: 성능 최적화를 위한 실험적 접근
- 제목 (타언어)
- Effective Combination of Resampling and Feature Selection Techniques in Manufacturing Process Data: An experimental approach to performance optimization
- 저자
- 한기수; 정현철; 김정은
- 발행일
- 2025-04
- 유형
- Y
- 저널명
- 데이타베이스연구
- 권
- 41
- 호
- 1
- 페이지
- 15 ~ 29