상세 보기
베이즈 요인 기반의 선형모형과 키워드네트워크를 이용한 특허 빅데이터 분석
Patent Big Data Analysis using Linear Models based on Bayes Factor and Keyword Networks
- 최성용;
- 전성해
초록
크기와 다양성의 특성을 갖는 빅데이터는 텍스트와 숫자뿐만 아니라 그림, 동영상, 센서 데이터 등 다양한 형태로 이루어진다. 특히, 웹, 보고서, 기사, 특허, 논문 등 텍스트 문서는 빅데이터의 상당 부분을 차지한다. 본 논문에서는 텍스트 빅데이터인 특허문서를 분석하기 위한 통계적 방법을 제안한다. 특허 빅데이터는 영과잉의 희소성 문제로 인하여 모형구축에어려움이 있다. 이 문제를 해결하기 위하여 본 논문에서는 베이즈 요인을 이용하여 최적의모형을 선택하고 모형에 포함된 키워드를 이용한 시각화를 수행하는 방법을 연구하고 이를통하여 특허 키워드 간의 기술 연관관계를 구축한다. 제안 방법의 성능평가를 위하여 특허데이터베이스로부터 실제 특허문서를 검색하고 분석하는 실험을 수행한다. 최종적으로 실험결과를 통하여 제안 방법의 실제 적용 가능성을 보이고 본 논문의 타당성을 확인한다.
키워드
베이즈 요인; 빅데이터; 특허문서; 키워드분석; 데이터 시각화; Bayes factor; big data; patent analysis; keyword analysis; data visualization
- 제목
- 베이즈 요인 기반의 선형모형과 키워드네트워크를 이용한 특허 빅데이터 분석
- 제목 (타언어)
- Patent Big Data Analysis using Linear Models based on Bayes Factor and Keyword Networks
- 저자
- 최성용; 전성해
- 발행일
- 2022-10
- 유형
- Y
- 저널명
- 한국지능시스템학회 논문지
- 권
- 32
- 호
- 5
- 페이지
- 359 ~ 365