베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석

Text Data Analysis using Bayesian Quantile Regression and Multidimensional Scaling

초록

웹 문서, 신문 기사, 보고서, 논문, 특허 등 상당 부분의 빅데이터는 텍스트 형태로 이루어진다. 따라서 텍스트 데이터의 분석은 빅데이터에서 중요하게 다루어지는 분야이다. 통계학과머신러닝을 이용한 텍스트 데이터의 분석을 위하여 수집된 텍스트 문서는 정형화된 데이터형태인 문서-단어 행렬로 전처리 된다. 일반적으로 이 행렬은 상당 부분의 원소가 0의 값을갖는 희소성 문제를 나타내기 때문에 이에 대한 해결방안이 필요하다. 본 논문에서는 베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석방법을 연구하여 이 문제를해결하려고 한다. 제안 방법의 실제 적용에 대한 성능평가를 위하여 가상확장현실과 관련된특허문서를 수집하여 분석하였다

키워드

베이지안 분위회귀모형다차원척도법텍스트데이터 희소성문서-단어 행렬특허문서Bayesian quantile regression modelmultidimensional scalingsparsity of text datadocument-word matrixpatent documents
제목
베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석
제목 (타언어)
Text Data Analysis using Bayesian Quantile Regression and Multidimensional Scaling
저자
최성용박상성전성해
DOI
10.5391/JKIIS.2021.31.2.177
발행일
2021-04
유형
Y
저널명
한국지능시스템학회 논문지
31
2
페이지
177 ~ 183