SDS 환경의 유사도 기반 클러스터링 및 다중 계층 블룸필터를 활용한 분산 중복제거 기법

Distributed data deduplication technique using similarity based clustering and multi-layer bloom filter

초록

클라우드 환경에서 다수의 사용자가 물리 서버를 가상화하여 사용할 수 있도록 편의성을 제공하는 Software Defined Storage(SDS)를 용하고 있지만 한정된 물리 자원을 고려하여 공간 효율성을 최화하는 솔루션이 필요하다. 기존의 데이터 복제거 시스템에서는 서로 다른 스토리지에 업로드 된 복 데이터가 복제거되기 어렵 다는 단이 있다. 본 논문에서는 유사도기반 클러스터링과 다 계층 블룸 필터를 용한 분산 복제거 기법을 제 안한다. 라빈 해시를 이용하여 가상 머신 서버들 간의 유사도를 단하고 유사도가 높은 가상머신들을 클러스터 함 으로써 개별 스토리지 노드별 복제거 효율에 비하여 성능을 향상시킨다. 한 복제거 로세스에 다 계층 블 룸 필터를 목하여 처리 시간을 단축하고 정오류를 감소시킬 수 있다. 실험결과 제안한 방법은 IP주소 기반 클러 스터를 이용한 복제거 기법에 비해 처리 시간의 차이가 없으면서, 복제거율이 9% 높아짐을 확인하다.

키워드

분산중복제거라빈해시다중계층블룸필터소트웨어 정의 스토리지Distributed DeduplicationRabin HashMulti-layer Bloom FilterSoftware Defined Storage
제목
SDS 환경의 유사도 기반 클러스터링 및 다중 계층 블룸필터를 활용한 분산 중복제거 기법
제목 (타언어)
Distributed data deduplication technique using similarity based clustering and multi-layer bloom filter
저자
윤다빈김덕환
발행일
2018-10
유형
Y
저널명
한국차세대컴퓨팅학회 논문지
14
5
페이지
60 ~ 70