2개의 q-그램에 대한 핑거프린트를 이용한 순위패턴매칭알고리즘

An Order-Preserving Pattern Matching Algorithm using Fingerprints of Two q-grams

초록

순위패턴매칭문제는 길이가 각각 n, m인 텍스트 T와 패턴 Р가 주어졌을 때, Р와 순위가 같은 T의 모든 부분문자열을 찾는 문제이다. 최근 q-그램의 핑거프린트를 이용한 O(nm+nqlogq+q!) 시간 순위패턴매칭 알고리즘이 제시되었다. 본 논문에서는 2개의 q-그램에 대한 핑거프린트를 이용하여 수행시간을 개선한 순위패턴매칭 알고리즘을 제시한다. 실험 결과, 본 논문에서 제시하는 알고리즘은 기존의알고리즘보다 무작위로 생성된 T(n=5,000,000)와 P(m=5,10,15)에 대해 최대 약 12% 빠르게 수행된다. 또한 다우존스지수 데이터를 이용한 T(n=34,685)와 T에서 무작위로 추출한 P(m=5,10,15)에 대해 최대 약 10% 빠르게 수행된다.

키워드

순위동형순위패턴매칭q-그램핑거프린트order-isomorphismorder-preserving pattern matchingq-gramfingerprint
제목
2개의 q-그램에 대한 핑거프린트를 이용한 순위패턴매칭알고리즘
제목 (타언어)
An Order-Preserving Pattern Matching Algorithm using Fingerprints of Two q-grams
저자
유광모김영호심정섭
DOI
10.5626/JOK.2018.45.11.1111
발행일
2018-11
유형
Y
저널명
정보과학회논문지
45
11
페이지
1111 ~ 1116