디지털 라이브러리[ 검색결과 ]
한정된 프라이버시 예산에서 배치 전략을 통한 차분 프라이버시 질의 처리 기법
http://doi.org/10.5626/JOK.2018.45.7.708
차분 프라이버시는 공격자의 사전 지식과 무관하게 정보를 보호할 수 있다는 장점이 있지만, 이를 위해 매 질의마다 프라이버시 예산 소모가 발생한다. 질의에 적용된 프라이버시 예산이 클수록 질의 결과는 정확해지지만 빠르게 프라이버시 예산이 고갈되어 많은 질의를 처리 할 수 없다. 많은 수의 질의를 처리하기 위해 각 질의에 대하여 프라이버시 예산을 지나치게 작게 할당하면 매우 많은 노이즈가 삽입되어 질의 결과의 정확도가 감소하고 데이터 유용성을 저하시킨다. 본 논문에서는 반응형 환경에서 차분프라이버시가 적용된 질의를 처리할 때, 배치 전략을 통한 질의 순서 재배열 처리를 통해 기존 기법보다 적은 프라이버시 예산을 사용하면서도 데이터 유용성을 보장하는 기법을 제안한다.
쿼드 트리를 이용한 동적 공간 분할 기반 차분 프라이버시 k-평균 클러스터링 알고리즘
http://doi.org/10.5626/JOK.2018.45.3.288
최근 공개되는 데이터에 적용하는 다양한 프라이버시 보호 기법들이 연구가 되어왔다. 그 중 차분 프라이버시는 본래의 데이터에 확률적인 노이즈를 더하여 공격자의 사전 지식에 상관없이 개인 정보를 보호한다. 기존 차분 프라이버시를 만족하는 k-평균 클러스터링은 데이터로부터 차분 프라이버시를 만족하는 히스토그램 형태로 바꾼 뒤. k-평균 클러스터링 알고리즘을 수행한다. 하지만 이는 데이터의 분포와 상관없이 등간격으로 히스토그램을 만들기 때문에 노이즈가 삽입되는 버킷이 많아지는 단점이 있다. 이를 해결하기 위해 본 논문에서는 데이터의 분포를 더 적은 버킷으로 나타낼 수 있는 쿼드 트리를 이용하여 히스토그램을 만든 뒤 k-평균을 찾는 알고리즘을 제안한다. 또한, 실험을 통해 기존의 알고리즘보다 더 좋은 성능을 가지는 것을 보인다.