상세 보기
분산스토리지 시스템에서 유사도 기반 클러스터를 적용한 데이터 중복제거 기법
초록
최근 클라우드 환경에서 데이터 크기와 양이 증가함에 따라 대용량 스토리지 제공이 가능한 분산 스토리지 시스템이 널리 활용되고 있다. 또한 분산 스토리지 시스템에 데이터 중복제거 기법을 적용하여 공간 효율성과 네트워크 효율을 증가 시키려는 연구가 활발히 진행되고 있다. 그러나 기존에 적용된 중복제거 기법은 스토리지 노드별로 독립된 중복제거를 진행하기 때문에 전체적인 스토리지 공간 효율성이 떨어지는 문제가 존재한다. 따라서 본 논문에서는 분산 스토리지 시스템에서 중복제거율을 높이기 위하여 유사도기반 클러스터를 적용한 데이터 중복제거 기법을 제안한다. 제안한 방법은 가상머신의 데이터에 대해 라빈 해시 기반으로 유사도를 판단하고 유사도가 높은 가상머신들과 중복제거 서버를 클러스터하여 중복제거를 진행한다. 실험결과, 제안한 방법은 기존 방법에 비해 중복제거율이 9% 향상됨을 보였다.
- 제목
- 분산스토리지 시스템에서 유사도 기반 클러스터를 적용한 데이터 중복제거 기법
- 저자
- KIM DEOKHWAN
- 학회명
- Korean Database Conference 2018(KDBC 2018)
- 개최지
- 인천 오라카이 송도파크호텔
- 학회 개최일
- 2018-10-19 ~ 2018-10-20