베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석

최성용; 박상성; 전성해

doi:10.5391/JKIIS.2021.31.2.177

상세 보기

베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석

Text Data Analysis using Bayesian Quantile Regression and Multidimensional Scaling

최성용;
박상성;
전성해

초록

웹 문서, 신문 기사, 보고서, 논문, 특허 등 상당 부분의 빅데이터는 텍스트 형태로 이루어진다. 따라서 텍스트 데이터의 분석은 빅데이터에서 중요하게 다루어지는 분야이다. 통계학과머신러닝을 이용한 텍스트 데이터의 분석을 위하여 수집된 텍스트 문서는 정형화된 데이터형태인 문서-단어 행렬로 전처리 된다. 일반적으로 이 행렬은 상당 부분의 원소가 0의 값을갖는 희소성 문제를 나타내기 때문에 이에 대한 해결방안이 필요하다. 본 논문에서는 베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석방법을 연구하여 이 문제를해결하려고 한다. 제안 방법의 실제 적용에 대한 성능평가를 위하여 가상확장현실과 관련된특허문서를 수집하여 분석하였다

키워드

베이지안 분위회귀모형; 다차원척도법; 텍스트데이터 희소성; 문서-단어 행렬; 특허문서; Bayesian quantile regression model; multidimensional scaling; sparsity of text data; document-word matrix; patent documents

제목: 베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석

제목 (타언어): Text Data Analysis using Bayesian Quantile Regression and Multidimensional Scaling

저자: 최성용; 박상성; 전성해

DOI: 10.5391/JKIIS.2021.31.2.177

발행일: 2021-04

유형: Y

저널명: 한국지능시스템학회 논문지

권: 31

호: 2

페이지: 177 ~ 183