다중 스케일 용종 영상 특징 맵간 의미론적 간극을 줄이는 양방향 융합 네트워크

Bi-directional Fusion Network to Reduce Semantic Gaps between Multi-scale Polyp Feature Maps

초록

대장내시경은 대장 내 점막에 있는 용종을 탐지하고 제거하는데 있어 현존하는 의학 기술 중 가장 효과적인 시술이다. 대장 내시경 검사 중 용종 검출 성능을 향상시키기 위한 용종 영상 분할 심층신경망 모델들이 제안되어왔다. 하지만, 용종은 다양한 크기와 형태를 지니고 주변 점막과 뚜렷하지 않은 경계를 가지고 있어 자동화된 용종 분할 시 일관적인 성능을 보장하기 어렵다. 용종 영상을 효과적으로 분할하기 위해서는 다양한 크기의 수용영역을 가진 특징 맵을 활용하는 것이 필요한데, 서로 다른 크기로 인해 의미론적 간극이 존재하는 특징 맵들을 융합하는 과정에서 정보 손실이 생길 수 있다. 이러한 문제를 해결하기 위해 본 논문에서는 다중 스케일에 강한 특징 맵 융합 및 정제 네트워크인 MPISNet (Multi-scale Polyp Image Segemtnation Network)을 제안한다. MPISNet에서는 새로운 융합 모듈인 SCBi-FPN (Semantically Calibrated Bi-directional Feature Pyramid Network)을 활용하여 특징 맵 간 의미론적 간극을 줄이고, 기존의 합성곱 신경망 주의 모듈인 CBAM (Convolutional Block Attention Module)을 활용하여 정제하였다. 결과적으로, Kvasir-SEG 데이터셋에서 기존 PraNet 모델에 비해 F1 스코어, 재현율, mIoU에서 각각 1.72%, 1.15%, 2.13%의 성능 향상을 보였으며 180fps의 합리적인 추론 속도를 보였다.

키워드

Deep learningConvolutional neural networkPolyp segmentationColonoscopyColorectal cancer
제목
다중 스케일 용종 영상 특징 맵간 의미론적 간극을 줄이는 양방향 융합 네트워크
제목 (타언어)
Bi-directional Fusion Network to Reduce Semantic Gaps between Multi-scale Polyp Feature Maps
저자
김수정남주현이상철
발행일
2023-11
유형
Y
저널명
전자공학회논문지
60
11
페이지
47 ~ 56