다중 표현 학습을 이용한 한국 영화 장르 예측 모델

김종현

상세 보기

다중 표현 학습을 이용한 한국 영화 장르 예측 모델

A Korean Movie Genre Prediction Model Using Multi-Representation Learning

김종현

초록

본 연구에서는 영화 포스터 이미지, 관람객 리뷰, 포스터 내 문구 등 서로 다른 표현 정보를 통합해 한국 영화 장르를 예측하는 다중 표현 학습 모델을 제안한다. 포스터는 CNN으로 시각적 특징을 학습하되, 포스터만으로 장르 맥락을 반영하기 어렵고 감독 의도와 관객 경험이 달라질 수 있다는 한계를 고려해 리뷰(Word2Vec)와 OCR 문구(LSTM) 기반 텍스트 모델을 추가로 구성했다. 세 모델의 장르 확률을 통합한 결과, 단일 포스터 CNN(약 78%) 대비 특정 장르에서 오류를 보완하며 전체적으로 약 75%의 안정적 성능을 보였다. 제안 모델은 멀티모달 결합을 통해 예측의 해석성과 신뢰도를 높였으며, 향후 장르 확장과 OCR 문구 가중치 조정으로 성능 개선을 목표로 한다.

키워드

Movie genre prediction; Multi-representation learning; Convolutional Neural Network; Natural Language Processing; 영화 장르 예측; 다중 표현 학습; 합성곱 신경망; 자연어 처리

제목: 다중 표현 학습을 이용한 한국 영화 장르 예측 모델

제목 (타언어): A Korean Movie Genre Prediction Model Using Multi-Representation Learning

저자: 김종현

발행일: 2026-03

유형: Y

저널명: 한국컴퓨터정보학회논문지

권: 31

호: 3

페이지: 139 ~ 147