Diffusion Model을 활용한 신용 예측 데이터 불균형 해결 기법

(Mitigating Data Imbalance in Credit Prediction using the Diffusion Model)

초록

본 논문에서는 신용 예측에서 발생하는 불균형 문제를 해결하기 위해 Diffusion Multi-step Classifier(DMC)를 제안한다. DMC는 Diffusion Model을 통해 신용 예측 데이터의 연속적인 수치형 데이터들을 생성하고 생성된 데이터들을 Multi-step Classifier로 구분하는 것으로 범주형 데이터를 생성한다. DMC를 통해 기존의 데이터를 생성하는 다른 알고리즘보다 실제 데이터와 유사한 분포를 가지는 데이터를 생성할 수 있었다. 이렇게 생성된 데이터를 사용하여 실험을 진행하였을 때 연체를 예측할 확률이 20%이상 상승하였으며, 전체적으로 예측 정확성은 약 4%정도 상승하였다. 이러한 연구 결과는 실제 금융기관에 적용 시 연체율 감소와 수익 증가에 큰 기여를 할 수 있을것으로 예상된다.

키워드

Credit predictionData imbalanceOversamplingDiffusion Model신용 예측데이터 불균형오버샘플링Diffusion Model
제목
Diffusion Model을 활용한 신용 예측 데이터 불균형 해결 기법
제목 (타언어)
(Mitigating Data Imbalance in Credit Prediction using the Diffusion Model)
저자
오상민이주홍
발행일
2024-02
유형
Y
저널명
스마트미디어저널
13
2
페이지
9 ~ 15