검색 : [ keyword: 시계열 데이터 ] (9)

조기 예측을 위한 시계열 데이터 불균형 해소 기법

안응선, 권태형, 김도국

http://doi.org/10.5626/JOK.2025.52.7.593

시계열 예측은 관측된 시계열 데이터를 분석하여 미래의 값을 예측하는 중요한 문제다. 그러나, 데이터가 불균형할 경우, 모델의 성능이 저하되고 예측 결과에 편향이 발생할 수 있다. 이를 해결하기 위해 최근 다양한 딥러닝 기법과 데이터 증강 방법들이 연구되고 있지만, 많은 연구들이 불균형 문제와 시계열 특성을 동시에 고려하지 못하여 근본적인 문제를 해결하지 못하고 있다. 본 연구에서는 시간적 패턴을 활용하여 샘플을 생성하는 조기 예측을 위한 방법을 제안한다. 제안된 기법은 긍정 및 부정 클래스를 효과적으로 구분할 수 있는 시점을 선정하여, 더 먼 시차에 대한 예측도 가능하게 한다. 본 연구에서 제안된 방법은 기존의 방법들보다 우수한 성능을 보였으며, 더 멀리 있는 시차에 대한 조기 예측의 가능성을 입증하였다.

특징 요약을 통한 공기조화 시뮬레이션 데이터의 혼합형 다변량 시계열 군집화 품질 향상

서하린, 서영균

http://doi.org/10.5626/JOK.2025.52.5.424

기존 다변량 시계열 데이터 군집 분석 방법은 정보의 손실을 초래하여 군집화 성능 및 해석 가능성이 저하되는 문제가 있다. 더욱이, 대부분의 기존 기법들은 수치형 변수에 초점을 맞추고 있어, 실-세계에서 흔한 혼합형 다변량 시계열 데이터셋에 적용하기 어렵다. 이러한 문제를 해결하기 위해, 본 논문은 시계열 데이터를 대표적인 특징으로 요약하여 해석 가능성을 높이는 새로운 혼합형 다변량 시계열 데이터 군집 분석 기법을 제안한다. 제안하는 기법은 혼합된 형을 갖는 다변량 시계열 데이터를 군집화하기 위해 특징을 요약한다는 점에서 기존 방법과 근본적으로 다르다. 우리는 두 개의 공기조화 시뮬레이션 데이터셋(MZVAV-1과 MZVAV-2-1)에 대해 세 개의 군집화 평가 지표를 사용하여 제안된 방법을 기존 기법과 비교 평가하였다. 실험 결과 제안한 방법은 MZVAV-1에서 지표-클러스터 개수 조합의 61% 이상, MZVAV-2-1에서 40% 이상의 군집화 품질에서 기존 기법보다 우수한 성능을 보였다. 이러한 결과는 제안한 방법이 혼합형 시계열 데이터를 위한 군집화 성능 및 해석 가능성을 상당히 개선할 수 있음을 확인시켜 준다.

센서별 시간지연 교차 상관관계를 이용한 GCN 기반의 시계열 데이터 이상 탐지 방법

이강우, 김윤영, 정성원

http://doi.org/10.5626/JOK.2023.50.9.805

시계열 데이터를 통한 장비 이상 탐지는 더 큰 피해를 방지하고 생산성 향상에 기여할 수 있어 매우 중요한 과제이다. 이와 관련하여 시계열 데이터 이상 탐지에 대한 연구가 활발히 진행되고 있지만, 다음과 같은 제약사항들이 있다. 첫째, 센서 간 상관관계를 분석하지 않기 때문에 불필요한 허위 알람이 발생한다. 둘째, 센서 간 상관관계를 분석하기 위해 완전 그래프로 모델링하고 GAT(Graph Attention Networks)를 적용하였으나, 불필요한 연산의 증가로 많은 분석시간이 소요된다. 본 논문에서는 위의 제약사항을 해결하기 위해 SC-GCNAD(Sensor-specific Correlation GCN Anomaly Detection)를 제안한다. SC-GCNAD는 시계열 데이터의 특징을 반영한 TLCC(Time Lagged Cross Correlation)를 적용하여 정확한 센서별 상관관계를 분석하고, 상관관계 표현력이 뛰어난 GCN(Graph Convolutional Networks)을 활용한다. 그 결과 기존 모델 대비 F1-Score는 최대 6.37% 향상하고, 분석시간은 최대 95.31% 단축한다.

적대적 훈련 기반의 시계열 데이터 증강 기법

신광훈, 김도국

http://doi.org/10.5626/JOK.2023.50.8.671

최근 시계열 데이터는 사물인터넷(IoT)의 발전으로 인해 다양한 산업에서 생성되고 있으며 이에 따라 각 산업에서의 시계열 예측 수요가 늘어나고 있다. 대량의 시계열 데이터가 확보됨에 따라 시계열 예측을 위한 전통적인 통계적 방법들 뿐 아니라 딥러닝에 기반한 시계열 예측 연구가 활발해졌으며 딥러닝에 필수적인 데이터 증강 기법들 필요성 또한 대두되고 있다. 본 논문에서는 적대적 훈련을 기반으로 한 새로운 시계열 데이터 증강 기법을 제안한다. 제안된 방법은 기존의 적대적 훈련과는 다르게 적대적 훈련 반복 횟수에 대한 하이퍼파라미터 값을 고정하였으며 섭동의 세기를 블록 단위로 클리핑하여 학습에 활용하였다. 실험 결과 다양한 데이터셋에 대한 제안 기법의 일관된 성능 향상 효과를 확인할 수 있었다. 뿐만 아니라 기존 적대적 훈련과는 다르게 본 논문에서 제안하는 블록 단위 클리핑 및 하이퍼파라미터 값 고정의 필요성 또한 비교 실험을 통하여 검증하였다.

단일 세포 분화 궤적 추론을 위한 시계열 다중 클러스터링 기법

장재연, 정인욱

http://doi.org/10.5626/JOK.2022.49.10.838

시계열 단일 세포 전사체 데이터에서 유전자 발현 정보는 중요한 세포의 분화 변화 시점을 관찰하기 위해 생성되며 실험조건과 관련하여 중요한 생물학적 현상 설명이 가능하다. 최근 시계열 단일 세포 전사체 데이터가 급증함에 따라 세포주기 및 분화와 같은 세포의 다양한 동적인 변화에 대한 연구가 활발히 진행되고 있다. 특히, 세포 분화에 대하여 단일 세포 수준에서의 시계열 분석은 시간 축으로의 변화 관찰이 가능하여 단일 시점에 비해 생물학적 해석이 유리하다. 본 논문에서는 시계열 단일 세포 전사체 데이터를 활용해 유전체 수준에서 시간 정보를 고려하여 세포 궤적을 추론하는 다중 클러스터링 기법을 제안한다. 해당 기법을 사용해 인간 뇌세포 분화과정에 대한 유전자 발현 데이터를 분석한 결과 사전 연구에서 밝혀낸 생물학적인 결과와 유사한 결과를 찾아냈다.

지역 차분 프라이버시를 만족하는 시계열 위치 데이터 수집 및 분석

정기정, 이혁기, 정연돈

http://doi.org/10.5626/JOK.2022.49.4.305

위치 데이터를 생성할 수 있는 스마트 기기의 보급에 따라 위치 기반 서비스가 폭발적으로 증가하고 있다. 사용자의 위치 데이터는 민감한 정보이기 때문에 원본을 그대로 이용한다면 개인의 프라이버시가 침해될 수 있다. 본 논문은 데이터 수집 환경에서 사용할 수 있는 강력한 프라이버시 모델인 지역 차분 프라이버시를 만족하는 시계열 위치 데이터 수집 방법과 시계열 위치 데이터의 특성을 고려한 분석방법을 제안한다. 데이터 수집 과정에서 개인의 위치는 비트 배열로 표현한다. 이후, 각 배열의 비트는 프라이버시 보호를 위해 확률 기반 응답을 이용하여 변조한다. 데이터 분석 과정에서는 은닉 마르코프 모델을 이용하여 위치 빈도 분석을 진행한다. 또한 기존 분석 기법에서 불가능한 시공간 상관관계 분석을 추가로 수행한다. 제안 기법의 성능을 보이기 위하여 서울시 지하철을 기반으로 가상의 경로 데이터를 생성하고, 제안하는 기법의 결과를 분석한다.

Visualization of Convolutional Neural Networks for Time Series Input Data

Sohee Cho, Jaesik Choi

http://doi.org/10.5626/JOK.2020.47.5.445

산업, 의료, 금융 등 다양한 분야에서 인공지능을 활용한 예측 및 진단이 늘어나면서, 인공지능의 내부 작동원리를 설명하는 연구에도 관심이 높아지고 있다. 이미지 데이터에서 중요 입력 특징점을 시각화하는 기존 연구들과 다르게, 본 논문에서는 시계열 데이터의 은닉 노드를 시각화하여 심층신경망 내부의 작동원리를 설명한다. 본 논문은 은닉 노드의 시각화를 쉽게 하도록 가중치 행렬(weight matrix)을 기준으로 은닉 노드를 군집화하여 패턴을 파악하였다. 이를 통해 심층학습 모델의 작동원리를 설명할 뿐만 아니라, 사용자 수준에서 시계열 데이터에 대한 이해를 높일 수 있었다.

희소하고 긴 시계열 데이터의 동적 시간 워핑 거리 상계값 개선

서장혁, 정우환, 심규석

http://doi.org/10.5626/JOK.2019.46.6.570

시계열 데이터 분석에서 널리 이용되는 거리 측도 중 하나인 동적 시간 워핑(Dynamic Time Warping, DTW)은 시계열 데이터의 길이가 길어질수록 시간이 오래 걸리는 단점이 존재한다. 이를 극복하기 위해 최근에 런-길이 부호화라는 압축 방법을 이용하여 DTW를 빠른 시간 내에 근사하는 알고리즘들이 개발되었다. 하지만 기존의 방법들로 계산된 DTW의 상계값에는 불필요하게 더해지는 거리값이 존재한다. 본 논문은 시간복잡도를 유지하면서 런-길이 부호화를 통한 DTW 근사 알고리즘들을 개선하는 동적계획법(Dynamic programming) 기반의 알고리즘을 제시한다. 또한, 현실 세계의 데이터 및 인공 데이터를 활용한 실험을 통해 제안하는 방법의 효용성을 보인다.

시계열 데이터 기반의 부분 노이즈 제거 윤곽선 이미지 매칭

김범수, 이상훈, 문양세

http://doi.org/

윤곽선 이미지 매칭에서 이미지의 노이즈를 제거하는 것은 직관적이고 정확한 매칭을 위해 매우 중요한 요소이다. 본 논문에서는 윤곽선 이미지 매칭에서 부분 노이즈를 허용하는 문제를 시계열 도메인에서 다룬다. 이를 위해, 먼저 부분 노이즈 제거 시계열(partial denoising time-series)을 정의하여 이미지 도메인이 아닌 시계열 도메인에서 매칭 문제를 신속하게 해결하는 방법을 제안한다. 다음으로, 두 윤곽선 이미지, 즉 질의 시계열과 데이터 시계열에서 구성된 부분 노이즈 제거 시계열들 간에 가질 수 있는 최소거리인 부분 노이즈 제거 거리(partial denoising distance)를 제시한다. 본 논문에서는 이를 두 윤곽선 이미지 간의 유사성 척도로 사용하여 윤곽선 이미지 매칭을 수행한다. 그러나, 부분 노이즈 제거 거리를 측정하기 위해서는 매우 많은 계산이 빈번하게 발생하므로, 본 논문에서는 부분 노이즈 제거 거리의 하한을 구하는 방법을 제안한다. 마지막으로, 부분 노이즈 제거 윤곽선 이미지 매칭의 질의 방식에 따라 범위 질의 매칭과 k-NN 질의 매칭을 각각 제안한다. 실험 결과, 제안한 부분 노이즈 제거 윤곽선 이미지 매칭은 성능을 수 배에서 수십 배까지 향상시킨 것으로 나타났다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr