디지털 라이브러리[ 검색결과 ]
적대적 훈련 기반의 시계열 데이터 증강 기법
http://doi.org/10.5626/JOK.2023.50.8.671
최근 시계열 데이터는 사물인터넷(IoT)의 발전으로 인해 다양한 산업에서 생성되고 있으며 이에 따라 각 산업에서의 시계열 예측 수요가 늘어나고 있다. 대량의 시계열 데이터가 확보됨에 따라 시계열 예측을 위한 전통적인 통계적 방법들 뿐 아니라 딥러닝에 기반한 시계열 예측 연구가 활발해졌으며 딥러닝에 필수적인 데이터 증강 기법들 필요성 또한 대두되고 있다. 본 논문에서는 적대적 훈련을 기반으로 한 새로운 시계열 데이터 증강 기법을 제안한다. 제안된 방법은 기존의 적대적 훈련과는 다르게 적대적 훈련 반복 횟수에 대한 하이퍼파라미터 값을 고정하였으며 섭동의 세기를 블록 단위로 클리핑하여 학습에 활용하였다. 실험 결과 다양한 데이터셋에 대한 제안 기법의 일관된 성능 향상 효과를 확인할 수 있었다. 뿐만 아니라 기존 적대적 훈련과는 다르게 본 논문에서 제안하는 블록 단위 클리핑 및 하이퍼파라미터 값 고정의 필요성 또한 비교 실험을 통하여 검증하였다.
단일 세포 분화 궤적 추론을 위한 시계열 다중 클러스터링 기법
http://doi.org/10.5626/JOK.2022.49.10.838
시계열 단일 세포 전사체 데이터에서 유전자 발현 정보는 중요한 세포의 분화 변화 시점을 관찰하기 위해 생성되며 실험조건과 관련하여 중요한 생물학적 현상 설명이 가능하다. 최근 시계열 단일 세포 전사체 데이터가 급증함에 따라 세포주기 및 분화와 같은 세포의 다양한 동적인 변화에 대한 연구가 활발히 진행되고 있다. 특히, 세포 분화에 대하여 단일 세포 수준에서의 시계열 분석은 시간 축으로의 변화 관찰이 가능하여 단일 시점에 비해 생물학적 해석이 유리하다. 본 논문에서는 시계열 단일 세포 전사체 데이터를 활용해 유전체 수준에서 시간 정보를 고려하여 세포 궤적을 추론하는 다중 클러스터링 기법을 제안한다. 해당 기법을 사용해 인간 뇌세포 분화과정에 대한 유전자 발현 데이터를 분석한 결과 사전 연구에서 밝혀낸 생물학적인 결과와 유사한 결과를 찾아냈다.
지역 차분 프라이버시를 만족하는 시계열 위치 데이터 수집 및 분석
http://doi.org/10.5626/JOK.2022.49.4.305
위치 데이터를 생성할 수 있는 스마트 기기의 보급에 따라 위치 기반 서비스가 폭발적으로 증가하고 있다. 사용자의 위치 데이터는 민감한 정보이기 때문에 원본을 그대로 이용한다면 개인의 프라이버시가 침해될 수 있다. 본 논문은 데이터 수집 환경에서 사용할 수 있는 강력한 프라이버시 모델인 지역 차분 프라이버시를 만족하는 시계열 위치 데이터 수집 방법과 시계열 위치 데이터의 특성을 고려한 분석방법을 제안한다. 데이터 수집 과정에서 개인의 위치는 비트 배열로 표현한다. 이후, 각 배열의 비트는 프라이버시 보호를 위해 확률 기반 응답을 이용하여 변조한다. 데이터 분석 과정에서는 은닉 마르코프 모델을 이용하여 위치 빈도 분석을 진행한다. 또한 기존 분석 기법에서 불가능한 시공간 상관관계 분석을 추가로 수행한다. 제안 기법의 성능을 보이기 위하여 서울시 지하철을 기반으로 가상의 경로 데이터를 생성하고, 제안하는 기법의 결과를 분석한다.
최대 수요 전력 저감을 위한 LSTM 기반 ESS 운영 스케줄링 기법
http://doi.org/10.5626/JOK.2019.46.11.1165
최근 우리나라의 최대 수요 전력 부하가 급격히 증가함에 따라 정전 확률이 올라가고 있다. 이에 대응하기 위해 energy storage system (ESS)에 저장한 전력을 활용하여 최대 수요 전력을 저감하는 ESS 운영 스케줄링 기법이 연구되고 있다. 수요 전력 정보를 미리 알고 있다면, ESS에 저장된 전력과 앞으로 발생할 수요 전력을 모두 고려하여 최적의 ESS 운영 스케줄링 기법을 적용할 수 있을 것이다. 그러나, 최대 수요 전력은 상대적으로 짧은 시간 구간에서만 발생하며 발생 시간도 일정하지 않아 예측이 매우 어렵다. 따라서, 미래의 수요 전력 정보를 미리 알고 있어야만 구현 가능한 최적의 ESS 운영 스케줄링기법은 실질적으로 적용이 어렵다. 본 논문에서는 과거에 측정된 수요 전력 정보만을 이용하는 ESS 운영스케줄링 기법을 제안하였다. 구체적으로, 과거에 측정된 수요 전력과 이에 대응되는 ESS의 최적 방전 전력을 입 · 출력 데이터로 활용하여 long short-term memory (LSTM) 신경망을 훈련하고 이를 ESS 운영스케줄링에 적용하였다. 제안 기법의 유효성을 검증하기 위해, 4곳의 전력 수용가들에 대한 수요 전력 데이터를 이용하여 실험을 수행하였다. 구체적으로, 제안 기법은 정확한 전력 수요 정보를 미리 알고 있어야만 구현 가능한 최적 운영스케줄링 기법 대비 최대 약 82.42%까지 연간 최대 수요 전력 감소를 달성할 수 있음을 확인하였다.
시계열 데이터 기반의 부분 노이즈 제거 윤곽선 이미지 매칭
윤곽선 이미지 매칭에서 이미지의 노이즈를 제거하는 것은 직관적이고 정확한 매칭을 위해 매우 중요한 요소이다. 본 논문에서는 윤곽선 이미지 매칭에서 부분 노이즈를 허용하는 문제를 시계열 도메인에서 다룬다. 이를 위해, 먼저 부분 노이즈 제거 시계열(partial denoising time-series)을 정의하여 이미지 도메인이 아닌 시계열 도메인에서 매칭 문제를 신속하게 해결하는 방법을 제안한다. 다음으로, 두 윤곽선 이미지, 즉 질의 시계열과 데이터 시계열에서 구성된 부분 노이즈 제거 시계열들 간에 가질 수 있는 최소거리인 부분 노이즈 제거 거리(partial denoising distance)를 제시한다. 본 논문에서는 이를 두 윤곽선 이미지 간의 유사성 척도로 사용하여 윤곽선 이미지 매칭을 수행한다. 그러나, 부분 노이즈 제거 거리를 측정하기 위해서는 매우 많은 계산이 빈번하게 발생하므로, 본 논문에서는 부분 노이즈 제거 거리의 하한을 구하는 방법을 제안한다. 마지막으로, 부분 노이즈 제거 윤곽선 이미지 매칭의 질의 방식에 따라 범위 질의 매칭과 k-NN 질의 매칭을 각각 제안한다. 실험 결과, 제안한 부분 노이즈 제거 윤곽선 이미지 매칭은 성능을 수 배에서 수십 배까지 향상시킨 것으로 나타났다.