다중 표현 학습을 이용한 한국 영화 장르 예측 모델

A Korean Movie Genre Prediction Model Using Multi-Representation Learning

초록

본 연구에서는 영화 포스터 이미지, 관람객 리뷰, 포스터 내 문구 등 서로 다른 표현 정보를 통합해 한국 영화 장르를 예측하는 다중 표현 학습 모델을 제안한다. 포스터는 CNN으로 시각적 특징을 학습하되, 포스터만으로 장르 맥락을 반영하기 어렵고 감독 의도와 관객 경험이 달라질 수 있다는 한계를 고려해 리뷰(Word2Vec)와 OCR 문구(LSTM) 기반 텍스트 모델을 추가로 구성했다. 세 모델의 장르 확률을 통합한 결과, 단일 포스터 CNN(약 78%) 대비 특정 장르에서 오류를 보완하며 전체적으로 약 75%의 안정적 성능을 보였다. 제안 모델은 멀티모달 결합을 통해 예측의 해석성과 신뢰도를 높였으며, 향후 장르 확장과 OCR 문구 가중치 조정으로 성능 개선을 목표로 한다.

키워드

Movie genre predictionMulti-representation learningConvolutional Neural NetworkNatural Language Processing영화 장르 예측다중 표현 학습합성곱 신경망자연어 처리
제목
다중 표현 학습을 이용한 한국 영화 장르 예측 모델
제목 (타언어)
A Korean Movie Genre Prediction Model Using Multi-Representation Learning
저자
김종현
발행일
2026-03
유형
Y
저널명
한국컴퓨터정보학회논문지
31
3
페이지
139 ~ 147