상세 보기
Diffusion Model을 활용한 신용 예측 데이터 불균형 해결 기법
(Mitigating Data Imbalance in Credit Prediction using the Diffusion Model)
- 오상민;
- 이주홍
초록
본 논문에서는 신용 예측에서 발생하는 불균형 문제를 해결하기 위해 Diffusion Multi-step Classifier(DMC)를 제안한다. DMC는 Diffusion Model을 통해 신용 예측 데이터의 연속적인 수치형 데이터들을 생성하고 생성된 데이터들을 Multi-step Classifier로 구분하는 것으로 범주형 데이터를 생성한다. DMC를 통해 기존의 데이터를 생성하는 다른 알고리즘보다 실제 데이터와 유사한 분포를 가지는 데이터를 생성할 수 있었다. 이렇게 생성된 데이터를 사용하여 실험을 진행하였을 때 연체를 예측할 확률이 20%이상 상승하였으며, 전체적으로 예측 정확성은 약 4%정도 상승하였다. 이러한 연구 결과는 실제 금융기관에 적용 시 연체율 감소와 수익 증가에 큰 기여를 할 수 있을것으로 예상된다.
키워드
Credit prediction; Data imbalance; Oversampling; Diffusion Model; 신용 예측; 데이터 불균형; 오버샘플링; Diffusion Model
- 제목
- Diffusion Model을 활용한 신용 예측 데이터 불균형 해결 기법
- 제목 (타언어)
- (Mitigating Data Imbalance in Credit Prediction using the Diffusion Model)
- 저자
- 오상민; 이주홍
- 발행일
- 2024-02
- 유형
- Y
- 저널명
- 스마트미디어저널
- 권
- 13
- 호
- 2
- 페이지
- 9 ~ 15