검색 : [ author: Woohwan Jung ] (2)

희소하고 긴 시계열 데이터의 동적 시간 워핑 거리 상계값 개선

서장혁, 정우환, 심규석

http://doi.org/10.5626/JOK.2019.46.6.570

시계열 데이터 분석에서 널리 이용되는 거리 측도 중 하나인 동적 시간 워핑(Dynamic Time Warping, DTW)은 시계열 데이터의 길이가 길어질수록 시간이 오래 걸리는 단점이 존재한다. 이를 극복하기 위해 최근에 런-길이 부호화라는 압축 방법을 이용하여 DTW를 빠른 시간 내에 근사하는 알고리즘들이 개발되었다. 하지만 기존의 방법들로 계산된 DTW의 상계값에는 불필요하게 더해지는 거리값이 존재한다. 본 논문은 시간복잡도를 유지하면서 런-길이 부호화를 통한 DTW 근사 알고리즘들을 개선하는 동적계획법(Dynamic programming) 기반의 알고리즘을 제시한다. 또한, 현실 세계의 데이터 및 인공 데이터를 활용한 실험을 통해 제안하는 방법의 효용성을 보인다.

쿼드 트리를 이용한 동적 공간 분할 기반 차분 프라이버시 k-평균 클러스터링 알고리즘

구한준, 정우환, 오성웅, 권수용, 심규석

http://doi.org/10.5626/JOK.2018.45.3.288

최근 공개되는 데이터에 적용하는 다양한 프라이버시 보호 기법들이 연구가 되어왔다. 그 중 차분 프라이버시는 본래의 데이터에 확률적인 노이즈를 더하여 공격자의 사전 지식에 상관없이 개인 정보를 보호한다. 기존 차분 프라이버시를 만족하는 k-평균 클러스터링은 데이터로부터 차분 프라이버시를 만족하는 히스토그램 형태로 바꾼 뒤. k-평균 클러스터링 알고리즘을 수행한다. 하지만 이는 데이터의 분포와 상관없이 등간격으로 히스토그램을 만들기 때문에 노이즈가 삽입되는 버킷이 많아지는 단점이 있다. 이를 해결하기 위해 본 논문에서는 데이터의 분포를 더 적은 버킷으로 나타낼 수 있는 쿼드 트리를 이용하여 히스토그램을 만든 뒤 k-평균을 찾는 알고리즘을 제안한다. 또한, 실험을 통해 기존의 알고리즘보다 더 좋은 성능을 가지는 것을 보인다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr