상세 보기
Skyline Search Algorithm for the Categoric Data
범주형 데이터에 대한 스카이라인 검색 알고리즘
초록
스카이라인 질의란 ‘지배한다(dominate)’의 개념을 활용하여 대량의 데이터에서 가장 좋은 Top-k 데이터를 매우 효과적으로 추출하는 방법이다[1]. 그래서 여러 차원을 가진 대량의 데이터들을 사용하여 의사결정 지원과 시각화를 하는데 유용하다. 기존의 스카이라인 알고리즘은 BNL[2], D&C[2], NN[1], BBS[3], Parallel 알고리즘[8] 등이 있는데, 이와 같은 기존의 스카이라인 탐색 알고리즘들은 연구가 진행됨에 따라 탐색 시간 및 효율성은 개선되어 가지만 대상 데이터가 수치형에 한정되어 있는 제한이 있었다. 본 논문에서는 텍스트 데이터 중 범주형 데이터에 대한 효과적인 스카이라인 질의 방법을 제안하고, 이를 대용량 데이터에 대해 실험하여 그 효과성을 입증하였다.
- 제목
- Skyline Search Algorithm for the Categoric Data
- 제목 (타언어)
- 범주형 데이터에 대한 스카이라인 검색 알고리즘
- 저자
- LEE WOOKEY
- 학회명
- 2009년 한국정보과학회 가을 학술발표대회
- 개최지
- 이화여자대학교
- 학회 개최일
- 2009-11-27 ~ 2009-11-28