로지스틱 회귀분석과 인공신경망을 이용한 유방암 분류 모델 비교연구

A Comparative Study on the Classification Model of Breast Cancer using Logistic Regression and Artificial Neural Networks

초록

인공신경망은 유용한 머신러닝 기법으로 활용되고 있지만, 기존 통계분석기법과 비교했을 때 한계점도 있다. 분석결과를 해석하기가 어렵기 때문이다. 특히, 변수 간의 관계 파악이 중요한 보건의료정보 연구에서는 이러한 단점이 두드러진다. 본 연구의 목적은 전통적인 통계기법과 머신러닝기법을 비교하여 관련 있는 인자를 조사하고 어떤 분석기법이 더 적절한지 판단하는 데 있다. 기존 유방암의 발병 요인은 식습관, 비만, 음주, 방사선 등으로 알려져 있으며, 데이터 분석기법으로는 로지스틱 회귀분석이 자주 사용되었다. 로지스틱 회귀분석은 결과를 해석하기가 용이한 것이 장점이지만, 설정한 모델의 예측력이 높지 않을 때도 있다. 이를 보완하고자 본 연구에서는 인공신경망으로 추가분석을 진행했다. 그 결과, 유방암의 생체지표로서 Age, BMI, Glucose, Insulin, Resistin이 관련 있다는 결론을 도출했다. 또한, k-fold Cross Validation을 이용해 모델의 성능을 비교했을 때 로지스틱 회귀분석과 인공신경망 모델의 성능에 큰 차이는 없었으며, 결과해석이 용이한 로지스틱 회귀분석이 더 적합한 분석기법일 수 있다는 것을 확인했다.

키워드

로지스틱 회귀분석인공신경망유방암생체지표k-foldlogistic regressionartificial neural networkbreast cancerbiomarkerk-fold
제목
로지스틱 회귀분석과 인공신경망을 이용한 유방암 분류 모델 비교연구
제목 (타언어)
A Comparative Study on the Classification Model of Breast Cancer using Logistic Regression and Artificial Neural Networks
저자
김낙일이철기이우기
발행일
2019-08
유형
Y
저널명
데이타베이스연구
35
2
페이지
139 ~ 153