디지털 라이브러리[ 검색결과 ]
패칭을 이용한 GRU 기반의 시계열 예측 방법
http://doi.org/10.5626/JOK.2024.51.7.663
시계열 예측은 기업, 현장에서 의사결정의 보조자 역할로 활용되어 매우 중요하다. 최근 트랜 스포머 구조의 patch time series Transformer(PatchTST)와 MLP 구조의 Long-term time series forecasting Linear(LTSF-Linear)가 시계열 예측에서 좋은 성능을 보여주었다. 하지만 PatchTST는 학습 및 추론시간이 오래 걸리고, LTSF-Linear는 구조의 단순함 때문에 훈련 데이터가 가지고 있는 정보를 제 한적으로 학습한다는 문제점이 있다. 이를 보완하기 위해 패칭된 데이터에 Gated Recurrent Unit(GRU)를 사용하여 학습시간 감소와 시계열 데이터에서 학습할 수 있는 정보를 담아낼 수 있는 patch time series GRU(PatchTSG)를 제안한다. PatchTSG는 PatchTST 대비 학습시간을 최대 82%, 추론시간을 최대 46%까지 감소시킨다.
센서별 시간지연 교차 상관관계를 이용한 GCN 기반의 시계열 데이터 이상 탐지 방법
http://doi.org/10.5626/JOK.2023.50.9.805
시계열 데이터를 통한 장비 이상 탐지는 더 큰 피해를 방지하고 생산성 향상에 기여할 수 있어 매우 중요한 과제이다. 이와 관련하여 시계열 데이터 이상 탐지에 대한 연구가 활발히 진행되고 있지만, 다음과 같은 제약사항들이 있다. 첫째, 센서 간 상관관계를 분석하지 않기 때문에 불필요한 허위 알람이 발생한다. 둘째, 센서 간 상관관계를 분석하기 위해 완전 그래프로 모델링하고 GAT(Graph Attention Networks)를 적용하였으나, 불필요한 연산의 증가로 많은 분석시간이 소요된다. 본 논문에서는 위의 제약사항을 해결하기 위해 SC-GCNAD(Sensor-specific Correlation GCN Anomaly Detection)를 제안한다. SC-GCNAD는 시계열 데이터의 특징을 반영한 TLCC(Time Lagged Cross Correlation)를 적용하여 정확한 센서별 상관관계를 분석하고, 상관관계 표현력이 뛰어난 GCN(Graph Convolutional Networks)을 활용한다. 그 결과 기존 모델 대비 F1-Score는 최대 6.37% 향상하고, 분석시간은 최대 95.31% 단축한다.
블록체인 기반의 지리 공간 포인트 데이터 인덱싱을 위한 공간 LSM 트리
http://doi.org/10.5626/JOK.2022.49.10.898
블록체인 기술은 IoT, 헬스케어 등 다양한 분야에서 높은 활용도로 주목받으며, 분산 데이터베이스에 대한 대안으로도 활용되고 있다. 블록체인에 대한 높은 활용성에도 불구하고, 블록체인 기반의 지리 공간 데이터를 효율적으로 인덱싱하는 기법은 지금까지 많은 연구가 진행되지 않았다. 이에 본 논문에서는 블록체인의 쓰기-집중적인(write-intensive) 특성을 반영하여 지리 공간 포인트 데이터의 블록을 블록체인에 삽입 시 I/O 비용을 감소시키는 공간 LSM 트리 인덱싱 기법을 제안한다. 제안 기법은 실시간으로 대량의 업데이트가 발생하는 블록체인 상에서 지리 공간 데이터를 Geohash를 통해 선형화하고, 데이터간의 공간적 인접성을 고려하여 데이터 삽입 및 범위 질의 처리 시 I/O 비용을 최소화한다. 또한, 지리 공간 포인트 데이터 범위 질의 처리 시 공간 LSM 트리에 대한 불필요한 탐색을 줄이기 위한 공간 필터를 제안한다.
LDA와 WMD 기반의 공간 변환을 이용한 효과적인 문서 클러스터링 방법
http://doi.org/10.5626/JOK.2021.48.9.1052
기존의 TF-IDF 기반의 문서 클러스터링 기법은 문서의 문맥 정보인 co-occurrence와 word-order에 대한 정보를 충분히 활용하지 못하고, “차원의 저주”로 인해 성능이 저하되는 문제가 있다. 이를 극복하기 위해서 워드 임베딩 벡터를 가중 평균을 하거나, Word Mover‘s Distance(WMD)를 사용한 기법들이 제안되었는데 제안된 기법들은 문서 간 분류에서는 좋은 성능을 보이지만, 문서 집단을 파악해야 하는 문서 클러스터링 에서는 좋은 성능을 보이지 못했다. 따라서 본 연구에서는 LDA를 활용하여 문서집단을 집단의 대표 문서인 토픽 문서로 새롭게 정의하여 토픽 문서를 기반으로 WMD를 계산하는 것으로 기존 문제를 해결한다. 하지만 WMD가 많은 계산량을 필요로 하기 때문에, 이를 해결하기 위해 각 문서를 토픽 문서와의 WMD값을 축으로 하는 저차원 공간으로 매핑하는 하는 것으로 계산량을 줄이면서 충분한 성능을 보이는 공간 변환 기법을 제시한다.
2-계층 그리드 블록을 이용한 효과적인 맵리듀스 기반 스카이라인 질의 처리 기법
http://doi.org/10.5626/JOK.2017.44.6.613
스카이라인 질의는 사용자들의 다양한 기준을 만족하는 데이터를 찾기 때문에 의사 결정 문제 등에서 폭넓게 사용되고 있다. 최근의 스카이라인 질의는 대용량 데이터베이스 처리를 위해 맵리듀스 프레임워크를 사용하는 연구들이 많이 진행되었으며 특히 맵리듀스에 기존의 색인 구조를 적용하는 방식으로 연구가 활발히 진행되고 있다. 스카이라인의 특징 중 하나는 원점에서 가까운 데이터일수록 더 많은 영역을 지배한다는 점이다. 하지만 기존의 색인 구조는 이와 같은 스카이라인의 특징을 반영하지 못하는 단점이 있었다. 본 논문에서는 그리드의 셀들을 스카이라인의 특징을 고려하여 묶는 그리드 블록 구조와 원점과 가까운 데이터가 없을 때도 사용 가능한 2계층 그리드 블록 구조, 그리고 2계층 그리드 블록 구조를 사용한 효율적인 스카이라인 질의 기법을 제안하였다.