상세 보기
베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석
Text Data Analysis using Bayesian Quantile Regression and Multidimensional Scaling
- 최성용;
- 박상성;
- 전성해
초록
웹 문서, 신문 기사, 보고서, 논문, 특허 등 상당 부분의 빅데이터는 텍스트 형태로 이루어진다. 따라서 텍스트 데이터의 분석은 빅데이터에서 중요하게 다루어지는 분야이다. 통계학과머신러닝을 이용한 텍스트 데이터의 분석을 위하여 수집된 텍스트 문서는 정형화된 데이터형태인 문서-단어 행렬로 전처리 된다. 일반적으로 이 행렬은 상당 부분의 원소가 0의 값을갖는 희소성 문제를 나타내기 때문에 이에 대한 해결방안이 필요하다. 본 논문에서는 베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석방법을 연구하여 이 문제를해결하려고 한다. 제안 방법의 실제 적용에 대한 성능평가를 위하여 가상확장현실과 관련된특허문서를 수집하여 분석하였다
키워드
베이지안 분위회귀모형; 다차원척도법; 텍스트데이터 희소성; 문서-단어 행렬; 특허문서; Bayesian quantile regression model; multidimensional scaling; sparsity of text data; document-word matrix; patent documents
- 제목
- 베이지안 분위회귀모형과 다차원척도법을 이용한 텍스트 데이터 분석
- 제목 (타언어)
- Text Data Analysis using Bayesian Quantile Regression and Multidimensional Scaling
- 저자
- 최성용; 박상성; 전성해
- 발행일
- 2021-04
- 유형
- Y
- 저널명
- 한국지능시스템학회 논문지
- 권
- 31
- 호
- 2
- 페이지
- 177 ~ 183