상세 보기
다변량 가우시안 마스크를 활용한 푸리에 변환 비지도 도메인 적응
초록
대장암 예방에 효과적인 기법인 대장내시경을 통해 수집된 영상은 수집 프로토콜, 대장내시경의 기기 설정값 등의 차이로 인해 병원마다 생성되는 영상의 특징이 상이하게 나타난다. 또한, 새로운 영상의 레이블을 만들기 위해서는 많은 비용과 시간이 투자되어야 한다. 해당 문제들을 해결하기 위해 비지도 도메인적응이 제안되었다. 특히, 이산 푸리에 변환을 이용한 Fourier Domain Adaptation (FDA)은 네트워크의 구조 변경 없이 성능을 향상시켰다. 하지만, FDA 은 이진 마스크를 통해 저주파를 이식하여 주파수 도메인에서 불연속 구간이 발생한다. 이를 해결하기 위해 본 논문에서는 이진 마스크를 2D 가우시안 마스크로 변경하여 아티팩트 없이 타겟 도메인의 컨텐츠를 소스 도메인에 이식하는 GFDA 방식을 제안한다. 이 방법을 통해 CVC-Clinic DB 을 소스 도메인으로 Kvasir-SEG 을 타겟 도메인으로 하여 기존 FDA 방식 대비 2.23%의 성능 향상을 달성하였다. 모델에 대한 코드는 https://github.com/SeongMon/GFDA 에서 사용 가능하다
- 제목
- 다변량 가우시안 마스크를 활용한 푸리에 변환 비지도 도메인 적응
- 저자
- Lee, Sang-Chul
- 학회명
- 제36회 영상처리 및 이해에 관한 워크샵
- 개최지
- 제주 메종글래드 컨벤션
- 학회 개최일
- 2024-01-31 ~ 2024-02-02