장애인 안전 이동을 위한 이미지 캡션 기반 시각 읽기 딥러닝 모델

초록

최근 급속히 등장하는 인공지능 모델들 중 장애인을 위한 모델이 부족한 가장 큰 이유는 데이터 량이 적기 때문이다. 장애인들이 활동함에 따라 데이터 량이 늘어나는데, 이동의 제약으로 인해 데이터가 충분히 생성되지 않기 때문에 악순환 현상이 발생하여 인공지능 시대에 소외될 가능성이 크다. 따라서 일반인들의 편의성 증대에 반비례하여 장애인의 불편을 해소하는 모델이나 서비스는 적어질 수 밖에 없는 구조이다. 만일 장애인들의 이동권 제한을 극복하고 주체적 이동이 가능해질 경우, 산재한 CC카메라 및 센서들을 통해 데이터 생산량도 많아져서 인공지능 모델개발에도 포함되는 선순환 효과를 낳을 것으로 기대한다. 이에 본 논문에서는 시각 장애인의 보행에 위협이 되는 요소들을 객체 인식 모델로 식별하고 이미지 캡셔닝 모델로 주위 상황에 대한 설명을 음성으로 제공하는 안전 보행 모델을 제안한다. 또한 보조적인 데이터 셋을 활용하여 최초 제안한 안전 보행 모델을 보완하고 강화할 수 있는 방법에 대해 설명한다. 이를 통해 장애인들의 주체적인 이동권을 향상시키며 인공지능 기술향상 및 모두가 안전한 사회에 기여할 것으로 기대한다.

제목
장애인 안전 이동을 위한 이미지 캡션 기반 시각 읽기 딥러닝 모델
저자
LEE WOOKEY
학회명
한국정보과학회학술대회
개최지
제주
학회 개최일
2021-06-23 ~ 2021-06-26