Skyline Search Algorithm for the Categoric Data

범주형 데이터에 대한 스카이라인 검색 알고리즘

초록

스카이라인 질의란 ‘지배한다(dominate)’의 개념을 활용하여 대량의 데이터에서 가장 좋은 Top-k 데이터를 매우 효과적으로 추출하는 방법이다[1]. 그래서 여러 차원을 가진 대량의 데이터들을 사용하여 의사결정 지원과 시각화를 하는데 유용하다. 기존의 스카이라인 알고리즘은 BNL[2], D&C[2], NN[1], BBS[3], Parallel 알고리즘[8] 등이 있는데, 이와 같은 기존의 스카이라인 탐색 알고리즘들은 연구가 진행됨에 따라 탐색 시간 및 효율성은 개선되어 가지만 대상 데이터가 수치형에 한정되어 있는 제한이 있었다. 본 논문에서는 텍스트 데이터 중 범주형 데이터에 대한 효과적인 스카이라인 질의 방법을 제안하고, 이를 대용량 데이터에 대해 실험하여 그 효과성을 입증하였다.

제목
Skyline Search Algorithm for the Categoric Data
제목 (타언어)
범주형 데이터에 대한 스카이라인 검색 알고리즘
저자
LEE WOOKEY
학회명
2009년 한국정보과학회 가을 학술발표대회
개최지
이화여자대학교
학회 개최일
2009-11-27 ~ 2009-11-28