상세 보기
초록
AI , 기술의 발전으로 양질의 데이터에 대한 수요가 증가했으나 개인정보 보호 문제로 인해이를 확보하기 어려운 상황이다 이에 대한 해결책으로 재현 데이터 가 주목 . (Synthetic Data)받고 있다 하지만 재현 데이터를 평가하는 안전성 지표에는 기준이 존재하지 않아 개인정 . 보 처리자는 생성한 재현 데이터가 안전하다는 것을 입증하기 어렵다 본 연구에서는 익명 . 화 기준에 따른 재식별 위험을 검증할 수 있는 안전성 지표를 도출하고 재현 데이터의 안전 ,성을 평가하기 위한 안전성 지표의 임계값 설정 방법을 제안한다 원본 데이터가 완벽하게 . 재현된 데이터라는 가정하에 시뮬레이션을 통해 임계값을 계산하는 방법을 제시하였다 한 , . 편 계산 시간이 오래 걸리는 시뮬레이션 방식의 대안으로 원본 데이터의 분포를 가정한 임계값 계산 방법도 함께 제안한다.
키워드
Synthetic Data; Safety Metrics; Thresholds; Data Privacy; 재현 데이터 안전성 지표 임계값 데이터 프라이버시
- 제목
- 재현 데이터 안전성 평가 지표의 임계값 연구
- 제목 (타언어)
- A Study of the Thresholds of Safety Evaluation Metrics for Synthetic Data
- 저자
- 박민수; 정미령; 박헌진; 김승환
- 발행일
- 2025-02
- 유형
- Y
- 저널명
- 한국지능시스템학회 논문지
- 권
- 35
- 호
- 1
- 페이지
- 9 ~ 15