디지털 라이브러리[ 검색결과 ]
밀도 기반 군집화 결과 공개를 위한 차분 프라이버시 기법
http://doi.org/10.5626/JOK.2024.51.4.380
군집화 기술은 비슷한 특성을 갖는 데이터들을 그룹화한다. 그 중 밀도 기반 공간 군집분석(DBSCAN)은 이상치(outlier)을 탐지할 수 있고 데이터 분포에 영향을 받지 않는 군집화 기술로 다양한 분야에서 널리 사용되고 있다. 하지만 기존의 DBSCAN 기법은 원본 데이터에 민감한 개인 정보들이 포함되어 있을 경우 군집화 수행 결과에서도 이러한 정보가 쉽게 유출된다는 점에서 취약하다. 따라서 프라이버시 보호조치 없이 이들 데이터를 공개 및 배포하는 것은 위험하다. 본 논문은 DBSCAN 결과를 차분 프라이버시를 만족하도록 가공 후 공개하는 방법을 제안한다. 또한, 후처리를 통해 차분 프라이버시를 적용하는 과정에서 발생하는 노이즈를 제거하여 향후 데이터 분석에 유용하도록 가공한다. 실험을 통해 제안 기법이 차분 프라이버시를 만족하면서 군집화의 특징은 남긴 채 불필요한 노이즈를 제거하여 결과의 유용성을 높인 것을 확인하였다.
프라이버시 보호 데이터 배포: 정형 및 비정형 데이터 비식별화 기술 동향
http://doi.org/10.5626/JOK.2023.50.11.1008
인공지능 시대에 접어들면서 인공지능 개발을 위한 데이터의 수요가 늘어나고 있고, 이에 따라 데이터 공유와 배포가 활발히 이루어지고 있다. 그러나 배포된 데이터 활용시 개인정보 유출의 위험이 있기 때문에 데이터를 배포하기 전에 비식별화 과정이 필요하다. 이러한 비식별화 과정에서 지정된 프라이버시 가이드라인을 준수하면서 동시에 데이터의 유용성을 최대한으로 유지하는 일련의 과정인 프라이버시 보호 데이터 배포(Privacy-Preserving Data Publishing, PPDP)가 꾸준히 연구되어 왔다. 2000년대 초반 부터 정형 데이터(예: 표 혹은 관계형 데이터)를 비식별화 하는 기술들이 연구되어 왔으며, 수집된 데이터의 상당 부분이 비정형 데이터이고 그 비율이 늘어나고 있는 현재 비정형 데이터의 비식별화 연구 또한 활발히 이루어지고 있다. 본 논문에서는 기존 정형 데이터의 비식별화 기법들을 소개한 후에 비정형 데이터 비식별화 기법들의 최근 동향에 대해서 서술한다.
가명정보 결합 활성화를 위한 차분 프라이버시 기반 프라이버시 보호 결합률 사전 계산
http://doi.org/10.5626/JOK.2022.49.3.250
데이터 3법이 시행되면서 다양한 분야의 가명정보를 지정된 전문기관을 통해 결합하여 활용할 수 있게 되었다. 전체 데이터를 결합하기 전에 전문기관은 두 가명정보 간의 결합률을 사전에 확인할 수 있는 서비스를 제공하고 있다. 하지만 기존의 결합률 사전 계산 방식은 프라이버시 침해가 발생할 수 있는 취약점을 가지고 있다. 본 논문은 전문기관이 제공하는 임의의 일회성 키값을 사용하여 결합 의뢰기관들이 단방향 해시 기법을 통해 데이터를 익명 처리 후 전문기관에 전달하는 방법과 전문기관에서 결합률 사전 계산 시 차분 프라이버시를 보장하는 프라이버시 보호 결합률 계산 방법을 제안한다. 제안하는 방법은 결합 의뢰기관이 전문기관에 제공하는 데이터의 익명성을 보장하며, 기존의 결합률 사전 계산 방법에서 발생할 수 있는 프라이버시 침해를 방지한다. 실험을 통해 제안 기법이 차분 프라이버시를 만족하면서도 유용한 결합률을 산출함을 확인하였다.
지능형 CCTV 환경에서의 다중객체 인증기반 프라이버시 보호방안
http://doi.org/10.5626/JOK.2019.46.2.154
지능형 CCTV 감시환경에서는 얼굴인식을 기반으로 개인의 신원을 확인한다. 그러나 아직까지도 현재의 얼굴인식 기술은 인식률이 완전하지 않다는 단점이 있다는 문제를 안고 있다. 특히, CCTV 촬영화질, 날씨, 개인의 포즈 및 표정, 헤어스타일, 조명상태 등 다양한 원인에 따라 얼굴인식이 정확하게 작동하지 않을 경우가 발생할 것이다. 이 경우, 잘못된 객체 판단으로 인하여 영상감시환경에서 객체의 프라이버시 정보를 노출하게 될 위험성이 크다. 제안하는 방법은 CCTV-RFID 복합인증방식을 기반으로 객체의 인식률을 보다 높일 수 있어 영상 객체의 프라이버시를 안전하게 보호할 수 있다는 장점이 있다.
프라이버시 보호 데이터 배포를 위한 모델 조사
최근 다양한 분야에서 데이터들이 활발하게 활용되고 있다. 이에 따라 데이터의 공유나 배포를 요구하는 목소리가 높아지고 있다. 그러나 공유된 데이터에 개인과 관련된 민감한 정보가 있을 경우, 개인의 민감한 정보가 드러나는 프라이버시 유출이 발생할 수 있다. 개인 정보가 포함된 데이터를 배포하기 위해 개인의 프라이버시를 보호하면서 데이터를 최소한으로 변형하는 프라이버시 보호 데이터 배포(privacy-preserving data publishing, PPDP)가 연구되어 왔다. 프라이버시 보호 데이터 배포 연구는 다양한 공격자 모델을 가정하고 이러한 공격자의 프라이버시 유출 공격으로부터 프라이버시를 보호하기 위한 원칙인 프라이버시 모델에 따라 발전해왔다. 본 논문에서는 먼저 프라이버시 유출 공격에 대해 알아본다. 그리고 프라이버시 모델들을 프라이버시 유출 공격에 따라 분류하고 각 프라이버시 모델들 간의 차이점과 요구 조건에 대해 알아본다.
주성분 분석의 안전한 다자간 계산
최근 대용량 데이터 대상의 프라이버시 보호 데이터 마이닝(privacy-preserving data mining : PPDM)이 활발히 연구되고 있다. 본 논문에서는 민감한 데이터 집합의 상관관계를 파악하는데 널리 사용되는 주성분 분석 기반의 PPDM을 다룬다. 일반적으로 주성분 분석은 모든 데이터를 한 곳에 모아 처리해야 하므로 민감한 데이터가 서로에게 공개되고, 상당한 계산량을 요구하며, 또한 데이터를 모으는 과정에서 많은 통신 오버헤드가 발생한다. 이러한 문제를 해결하기 위하여 본 논문은 데이터를 한 곳에 모으지 않고도 주성분 분석을 안전하게 계산하는 효율적인 방법을 제안한다. 제안하는 방법은 노드들 간에 한정된 정보만을 공유하면서도 원래의 주성분 분석 결과와 동일한 결과를 얻을 수 있다. 또한 안전한 주성분 분석에 저차원 변환을 적용하여 안전한 유사 문서 검색에 사용한다. 마지막으로 다양한 실험을 통해 제안한 방법이 대용량의 다차원 데이터에서 효율적으로 동작함을 확인한다.
상관계수의 안전한 다자간 계산
본 논문에서는 분산 컴퓨팅 환경에서 데이터 제공자들이 각자 소유한 데이터의 프라이버시는 보호하면서도 피어슨(Pearson) 상관계수와 스피어만(Spearman)의 순위상관계수를 안전하게 계산하는 해결책을 각각 제안한다. 분산 컴퓨팅 환경에서 마이닝(또는 데이터 분석)을 수행하기 위해서는 원본 데이터를 상대방에게 제공해야 한다. 그러나, 원본 데이터는 민감한 정보를 포함하는 경우가 많고, 이때 데이터 제공자(소유자)는 프라이버시 보호를 이유로 정확한 값을 직접 노출하기를 원하지 않는다. 본 논문에서는 분산 컴퓨팅 환경의 데이터 제공자들이 각자 소유한 데이터는 상대방에게 공개하지 않으면서 상관관계를 계산하는 문제, 즉 안전한 상관관계 계산(SCC: Secure Correlation Computation) 문제를 정형적으로 정의한다. 그리고, 임의 행렬 기반 안전한 스칼라 곱을 사용하여 피어슨 상관계수와 순위상관계수에 대한 SCC 문제를 해결하는 방법을 각각 제안한다. 제안한 해결책이 바르게 수행함을 보이기 위해, 정확성과 안전성을 정리로 제시하고 증명한다. 또한, 실험을 통해 제안한 기법이 수행 시간 측면에서도 실용적인 방법임을 보인다.