재현 데이터 안전성 평가 지표의 임계값 연구

A Study of the Thresholds of Safety Evaluation Metrics for Synthetic Data

초록

AI , 기술의 발전으로 양질의 데이터에 대한 수요가 증가했으나 개인정보 보호 문제로 인해이를 확보하기 어려운 상황이다 이에 대한 해결책으로 재현 데이터 가 주목 . (Synthetic Data)받고 있다 하지만 재현 데이터를 평가하는 안전성 지표에는 기준이 존재하지 않아 개인정 . 보 처리자는 생성한 재현 데이터가 안전하다는 것을 입증하기 어렵다 본 연구에서는 익명 . 화 기준에 따른 재식별 위험을 검증할 수 있는 안전성 지표를 도출하고 재현 데이터의 안전 ,성을 평가하기 위한 안전성 지표의 임계값 설정 방법을 제안한다 원본 데이터가 완벽하게 . 재현된 데이터라는 가정하에 시뮬레이션을 통해 임계값을 계산하는 방법을 제시하였다 한 , . 편 계산 시간이 오래 걸리는 시뮬레이션 방식의 대안으로 원본 데이터의 분포를 가정한 임계값 계산 방법도 함께 제안한다.

키워드

Synthetic DataSafety MetricsThresholdsData Privacy재현 데이터 안전성 지표 임계값 데이터 프라이버시
제목
재현 데이터 안전성 평가 지표의 임계값 연구
제목 (타언어)
A Study of the Thresholds of Safety Evaluation Metrics for Synthetic Data
저자
박민수정미령박헌진김승환
발행일
2025-02
유형
Y
저널명
한국지능시스템학회 논문지
35
1
페이지
9 ~ 15