검색 : [ author: 백인철 ] (2)

밀도 기반 군집화 결과 공개를 위한 차분 프라이버시 기법

김남일, 백인철, 이협진, 김민수, 정연돈

http://doi.org/10.5626/JOK.2024.51.4.380

군집화 기술은 비슷한 특성을 갖는 데이터들을 그룹화한다. 그 중 밀도 기반 공간 군집분석(DBSCAN)은 이상치(outlier)을 탐지할 수 있고 데이터 분포에 영향을 받지 않는 군집화 기술로 다양한 분야에서 널리 사용되고 있다. 하지만 기존의 DBSCAN 기법은 원본 데이터에 민감한 개인 정보들이 포함되어 있을 경우 군집화 수행 결과에서도 이러한 정보가 쉽게 유출된다는 점에서 취약하다. 따라서 프라이버시 보호조치 없이 이들 데이터를 공개 및 배포하는 것은 위험하다. 본 논문은 DBSCAN 결과를 차분 프라이버시를 만족하도록 가공 후 공개하는 방법을 제안한다. 또한, 후처리를 통해 차분 프라이버시를 적용하는 과정에서 발생하는 노이즈를 제거하여 향후 데이터 분석에 유용하도록 가공한다. 실험을 통해 제안 기법이 차분 프라이버시를 만족하면서 군집화의 특징은 남긴 채 불필요한 노이즈를 제거하여 결과의 유용성을 높인 것을 확인하였다.

차분 프라이버시를 보장하는 프라이버시 보호 히스토그램 생성 기법

백인철, 김종선, 정연돈

http://doi.org/10.5626/JOK.2022.49.6.488

데이터 수집과 분석이 활발히 이루어지면서 개인의 프라이버시 보호의 필요성이 대두되고 있다. 프라이버시를 보호하면서 데이터의 수집과 분석을 수행하기 위해 다양한 프라이버시 모델이 제안되었다. 그 중 차분 프라이버시가 사실상의 표준으로 받아들여지고 있다. 본 논문에선 차분 프라이버시를 보장하는 프라이버시 보호 히스토그램 생성 기법을 제안한다. 제안 기법은 히스토그램의 계급 구간 설정 단계와 도수 산출 단계로 구성된다. 첫번째 단계에서는 계급 구간을 결정하는 휴리스틱 알고리즘에 라플라스 메커니즘을 적용하여 차분 프라이버시를 만족하는 계급 구간 개수를 설정한다. 두번째 단계에서는 각 계급 구간에 해당하는 도수에 라플라스 메커니즘을 적용하여 차분 프라이버시를 보장하는 도수를 산출한다. 제안하는 기법이 차분 프라이버시를 보장함을 보이고, 실험을 통해 프라이버시 예산 값의 크기와 분배 비율에 따른 히스토그램의 정확성을 비교한다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr