검색 : [ author: Yon Dohn Chung ] (6)

밀도 기반 군집화 결과 공개를 위한 차분 프라이버시 기법

김남일, 백인철, 이협진, 김민수, 정연돈

http://doi.org/10.5626/JOK.2024.51.4.380

군집화 기술은 비슷한 특성을 갖는 데이터들을 그룹화한다. 그 중 밀도 기반 공간 군집분석(DBSCAN)은 이상치(outlier)을 탐지할 수 있고 데이터 분포에 영향을 받지 않는 군집화 기술로 다양한 분야에서 널리 사용되고 있다. 하지만 기존의 DBSCAN 기법은 원본 데이터에 민감한 개인 정보들이 포함되어 있을 경우 군집화 수행 결과에서도 이러한 정보가 쉽게 유출된다는 점에서 취약하다. 따라서 프라이버시 보호조치 없이 이들 데이터를 공개 및 배포하는 것은 위험하다. 본 논문은 DBSCAN 결과를 차분 프라이버시를 만족하도록 가공 후 공개하는 방법을 제안한다. 또한, 후처리를 통해 차분 프라이버시를 적용하는 과정에서 발생하는 노이즈를 제거하여 향후 데이터 분석에 유용하도록 가공한다. 실험을 통해 제안 기법이 차분 프라이버시를 만족하면서 군집화의 특징은 남긴 채 불필요한 노이즈를 제거하여 결과의 유용성을 높인 것을 확인하였다.

차분 프라이버시를 보장하는 프라이버시 보호 히스토그램 생성 기법

백인철, 김종선, 정연돈

http://doi.org/10.5626/JOK.2022.49.6.488

데이터 수집과 분석이 활발히 이루어지면서 개인의 프라이버시 보호의 필요성이 대두되고 있다. 프라이버시를 보호하면서 데이터의 수집과 분석을 수행하기 위해 다양한 프라이버시 모델이 제안되었다. 그 중 차분 프라이버시가 사실상의 표준으로 받아들여지고 있다. 본 논문에선 차분 프라이버시를 보장하는 프라이버시 보호 히스토그램 생성 기법을 제안한다. 제안 기법은 히스토그램의 계급 구간 설정 단계와 도수 산출 단계로 구성된다. 첫번째 단계에서는 계급 구간을 결정하는 휴리스틱 알고리즘에 라플라스 메커니즘을 적용하여 차분 프라이버시를 만족하는 계급 구간 개수를 설정한다. 두번째 단계에서는 각 계급 구간에 해당하는 도수에 라플라스 메커니즘을 적용하여 차분 프라이버시를 보장하는 도수를 산출한다. 제안하는 기법이 차분 프라이버시를 보장함을 보이고, 실험을 통해 프라이버시 예산 값의 크기와 분배 비율에 따른 히스토그램의 정확성을 비교한다.

지역 차분 프라이버시를 만족하는 시계열 위치 데이터 수집 및 분석

정기정, 이혁기, 정연돈

http://doi.org/10.5626/JOK.2022.49.4.305

위치 데이터를 생성할 수 있는 스마트 기기의 보급에 따라 위치 기반 서비스가 폭발적으로 증가하고 있다. 사용자의 위치 데이터는 민감한 정보이기 때문에 원본을 그대로 이용한다면 개인의 프라이버시가 침해될 수 있다. 본 논문은 데이터 수집 환경에서 사용할 수 있는 강력한 프라이버시 모델인 지역 차분 프라이버시를 만족하는 시계열 위치 데이터 수집 방법과 시계열 위치 데이터의 특성을 고려한 분석방법을 제안한다. 데이터 수집 과정에서 개인의 위치는 비트 배열로 표현한다. 이후, 각 배열의 비트는 프라이버시 보호를 위해 확률 기반 응답을 이용하여 변조한다. 데이터 분석 과정에서는 은닉 마르코프 모델을 이용하여 위치 빈도 분석을 진행한다. 또한 기존 분석 기법에서 불가능한 시공간 상관관계 분석을 추가로 수행한다. 제안 기법의 성능을 보이기 위하여 서울시 지하철을 기반으로 가상의 경로 데이터를 생성하고, 제안하는 기법의 결과를 분석한다.

가명정보 결합 활성화를 위한 차분 프라이버시 기반 프라이버시 보호 결합률 사전 계산

이협진, 김종선, 정연돈

http://doi.org/10.5626/JOK.2022.49.3.250

데이터 3법이 시행되면서 다양한 분야의 가명정보를 지정된 전문기관을 통해 결합하여 활용할 수 있게 되었다. 전체 데이터를 결합하기 전에 전문기관은 두 가명정보 간의 결합률을 사전에 확인할 수 있는 서비스를 제공하고 있다. 하지만 기존의 결합률 사전 계산 방식은 프라이버시 침해가 발생할 수 있는 취약점을 가지고 있다. 본 논문은 전문기관이 제공하는 임의의 일회성 키값을 사용하여 결합 의뢰기관들이 단방향 해시 기법을 통해 데이터를 익명 처리 후 전문기관에 전달하는 방법과 전문기관에서 결합률 사전 계산 시 차분 프라이버시를 보장하는 프라이버시 보호 결합률 계산 방법을 제안한다. 제안하는 방법은 결합 의뢰기관이 전문기관에 제공하는 데이터의 익명성을 보장하며, 기존의 결합률 사전 계산 방법에서 발생할 수 있는 프라이버시 침해를 방지한다. 실험을 통해 제안 기법이 차분 프라이버시를 만족하면서도 유용한 결합률을 산출함을 확인하였다.

날씨 특성을 고려한 그래프 임베딩 기반 관심 장소 추천

이건우, 김종선, 정연돈

http://doi.org/10.5626/JOK.2022.49.3.221

관심 장소 추천은 위치 기반 서비스들이 빠르게 증가하면서 사용자들에게 그들의 위치와 관련된 적절한 정보를 제공하고자 활발히 연구되고 있는 분야이다. 최근 TransRec과 같이 그래프 임베딩을 사용한 번역 기반 추천 시스템이 큰 관심을 받고 있다. 본 논문은 TransRec이 사용자와 장소 사이의 복잡한 관계를 표현하기 어렵고, 관계 임베딩이 날씨 특성을 고려하지 않고 고정되어 있다는 단점을 발견하였다. TransRec의 단점을 극복하고자, 날씨를 고려한 그래프 임베딩 기반 관심 장소 추천 기법 WAPTRec을 제안한다. WAPTRec은 범주 투영 행렬과 어텐션 메커니즘을 사용하여 동일한 장소 임베딩을 사용자마다 다르게 표현할 수 있다. 또한, 사용자의 과거 이동 기록과 장소의 범주, 그리고 날씨 특성을 활용하여 더 높은 추천 정확도를 제공한다. 공개 데이터 셋을 이용한 실험을 통해 WAPTRec이 기존의 번역 기반 추천 방법들보다 뛰어남을 보인다.

프라이버시 보호 데이터 배포를 위한 모델 조사

김종선, 정기정, 이혁기, 김수형, 김종욱, 정연돈

http://doi.org/

최근 다양한 분야에서 데이터들이 활발하게 활용되고 있다. 이에 따라 데이터의 공유나 배포를 요구하는 목소리가 높아지고 있다. 그러나 공유된 데이터에 개인과 관련된 민감한 정보가 있을 경우, 개인의 민감한 정보가 드러나는 프라이버시 유출이 발생할 수 있다. 개인 정보가 포함된 데이터를 배포하기 위해 개인의 프라이버시를 보호하면서 데이터를 최소한으로 변형하는 프라이버시 보호 데이터 배포(privacy-preserving data publishing, PPDP)가 연구되어 왔다. 프라이버시 보호 데이터 배포 연구는 다양한 공격자 모델을 가정하고 이러한 공격자의 프라이버시 유출 공격으로부터 프라이버시를 보호하기 위한 원칙인 프라이버시 모델에 따라 발전해왔다. 본 논문에서는 먼저 프라이버시 유출 공격에 대해 알아본다. 그리고 프라이버시 모델들을 프라이버시 유출 공격에 따라 분류하고 각 프라이버시 모델들 간의 차이점과 요구 조건에 대해 알아본다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr