디지털 라이브러리[ 검색결과 ]
특징 요약을 통한 공기조화 시뮬레이션 데이터의 혼합형 다변량 시계열 군집화 품질 향상
http://doi.org/10.5626/JOK.2025.52.5.424
기존 다변량 시계열 데이터 군집 분석 방법은 정보의 손실을 초래하여 군집화 성능 및 해석 가능성이 저하되는 문제가 있다. 더욱이, 대부분의 기존 기법들은 수치형 변수에 초점을 맞추고 있어, 실-세계에서 흔한 혼합형 다변량 시계열 데이터셋에 적용하기 어렵다. 이러한 문제를 해결하기 위해, 본 논문은 시계열 데이터를 대표적인 특징으로 요약하여 해석 가능성을 높이는 새로운 혼합형 다변량 시계열 데이터 군집 분석 기법을 제안한다. 제안하는 기법은 혼합된 형을 갖는 다변량 시계열 데이터를 군집화하기 위해 특징을 요약한다는 점에서 기존 방법과 근본적으로 다르다. 우리는 두 개의 공기조화 시뮬레이션 데이터셋(MZVAV-1과 MZVAV-2-1)에 대해 세 개의 군집화 평가 지표를 사용하여 제안된 방법을 기존 기법과 비교 평가하였다. 실험 결과 제안한 방법은 MZVAV-1에서 지표-클러스터 개수 조합의 61% 이상, MZVAV-2-1에서 40% 이상의 군집화 품질에서 기존 기법보다 우수한 성능을 보였다. 이러한 결과는 제안한 방법이 혼합형 시계열 데이터를 위한 군집화 성능 및 해석 가능성을 상당히 개선할 수 있음을 확인시켜 준다.
시간 접두어를 활용한 트라이 기반 IoT 데이터 인덱싱 기법
http://doi.org/10.5626/JOK.2024.51.3.280
사물인터넷 기술이 널리 보급되면서 생성된 대량의 IoT 센서 데이터를 효율적으로 검색하기 위한 다양한 기법들이 제안됐다. 이중 최신 기법 중 하나인 ST-Trie는 하루 이하의 좁은 시간대를 갖는 시공간 범위 질의에서 타 복합 색인 기법에 비해 상대적으로 질의 처리 성능이 나쁘다는 단점을 노출하였다. 이 문제를 해결하기 위해 본 논문은 시간 접두사를 이용한 트라이 기반 인덱싱 기법인 TS-Trie를 제안한다. TS-Trie는 3차원 시공간 정보를 64비트 1차원 키값으로 매핑할 때 접두사로 20비트 시간정보를 사용한다. 또한 20비트 이후 노드를 이중 연결 리스트로 구축해 기존의 검색 방식을 개선하였다. 제안한 TS-Trie는 세 개의 실-세계 IoT 데이터셋에 대한 범위 질의, k-NN 그리고 Top-k 질의에 대해 기존 방법 대비 평균 약 50%, 40% 그리고 60% 검색 시간을 줄일 수 있었다. 또한 기존 방법 대비 평균 약 4배 빠른 색인 구축 속도를 보여주었으며 86%의 높은 압축률을 통해 TS-Trie의 우수한 공간 효율성을 확인하였다.
LNGC 환경 예측 모델을 이용한 심층 강화학습 기반 에너지-효율적 공조 제어 방법
http://doi.org/10.5626/JOK.2022.49.12.1062
본 논문은 건조 중인 LNG 화물창 환경을 안정적으로 유지하고 에너지를 최소화하기 위한 심층 강화학습 기반 공조 제어 방법을 제안한다. 건조 중인 화물창 내부와 같은 특수한 환경은 여러 요인에 의해 영향받기 쉬우므로, 정보를 정확히 예측하여 에너지 소모가 많은 공조 시스템을 자동으로 제어하기 어렵다. 이러한 문제를 완화하기 위해, 우리는 심층 강화 학습 모델을 통해 훈련된 공조 제어 에이전트를 통해 실내 환경을 안정적으로 제어하는 최신 방법을 제안한다. 이 방법에서는 운영 상황에 대한 전문지식 없이, 수집된 데이터의 상관 분석을 기반으로 실내 환경 상태 예측 모델을 구성하고, 모델을 기반으로 상태와 행동을 정의한 후 보상 기능을 통해 정책으로 훈련된 에이전트를 구축한다. 제안한 방법의 유효성을 확인하기 위하여, 우리는 실제 LNG 화물창 내부 공조 시스템에서 수집한 데이터를 이용하여 구축한 시뮬레이션 환경에서 HVAC 제어 성능 평가를 수행한다. 우리의 시뮬레이션 결과는 본 논문에서 고려하였던 3종의 강화학습 모델 중 Double DQN 모델이 공조 제어에 가장 효과적임을 보인다. 또한, 그 결과는 학습된 에이전트가 사용자-지정 온도 내에서 화물창 내부 환경을 안정적으로 유지 시키면서 일 평균 28.2%까지 전력 소모를 줄일 수 있음을 보인다.
방대한 시공간 IoT 센서 데이터의 효율적인 검색을 위한 트라이 기반 색인 방법
추하원, 서영균, 이용, 박민우, 장래영, 이상환, 송사광
http://doi.org/10.5626/JOK.2020.47.12.1199
통신 기술과 컴퓨팅 능력의 발전으로 인해 사물인터넷 센서가 여러 분야에 보편화되면서 대량의 시공간 사물 데이터가 끊임없이 생성되고 있다. 고차원적인 추가 분석을 위해, 그러한 거대한 시공간 사물 데이터를 저장 시스템에 수집하는 것은 고도화된 저장 기술 덕분에 그리 어렵지 않게 되었다. 그럼에도 불구하고, 사물데이터의 거대한 양과 복잡한 시공간성으로 인해 질의된 사물 데이터를 신속히 찾아내는 것은 여전히 도전적인 문제로 여겨져 왔다. 본 논문은 이러한 문제점을 해결하기 위해 시공간성을 가진 대용량 사물 데이터에 대해 효율적인 검색을 지원하는 색인 방법인 ST-Trie를 제안한다. ST-Trie의 핵심 아이디어는 시공간 지역성을 고려하여 3차원 시공간 정보를 1차원 데이터로 부호화한 다음, 이를 논리적인 트라이(Trie) 구조로 조직하는 것이다. 제안된 방법인 ST-Trie에 대한 실제 사물인터넷 센서로부터 얻은 데이터 셋들을 이용한 실험 결과, ST-Trie가 질의 응답 시간에 관하여 비교된 복합 색인보다 최대 92배 더 높은 성능을 보였다. 특히, 우리는 ST-Trie가 주어진 시간 범위가 커질수록 더 확장성 있는 검색을 수행하였음을 확인하였다.
고품질 빅데이터 분석을 위한 최적의 전처리 순열 추천 방법
http://doi.org/10.5626/JOK.2020.47.3.319
오늘날 폭발적인 데이터의 증가로, 다양한 분야에서 빅데이터 분석을 통한 지능 서비스 연구가 활발히 진행 중이다. 데이터 마이닝 또는 기계 학습을 통한 빅데이터 분석은 학습 데이터에 대한 전처리가 필수적이다. 주어진 데이터에 대한 불완전하고 부적절한 전처리는 신뢰하기 힘든 분석 결과를 낳을 수 있음에도 불구하고, 사용자가 최상의 결과를 도출할 수 있는 전처리 함수들에 대한 최적의 집합 및 그 순서를 선택하는 것은 어렵다. 이러한 문제를 역설하기 위해, 본 논문에서는 사용자가 제공한 데이터에 최적화된 전처리 함수들의 순열을 분석하고 추천하는 플랫폼을 설계하고 구현하였다. 제안된 추천 방법을 실세계 데이터를 사용하여 평가한 결과는 최적의 전처리 순열은 최악의 전처리 순열과 비교하여 정확도 측면에서 가장 뛰어난 성능을 보이고 있음을 입증한다. 사용자는 본 논문이 제안하는 방법을 적용하여 최상의 전처리 순열을 선택할 수 있어 고품질 빅데이터 분석 결과를 얻을 수 있을 것으로 기대된다.
데이터베이스의 과학에 대한 고찰 및 연구 사례 분석
본 논문은 새로운 연구 분야인, 데이터베이스의 과학을 소개하고 그에 대한 연구 사례들을 분석한다. 데이터베이스에 대한 과학은 다중의 데이터베이스 관리 시스템에서 교차되어 관찰되는 흥미로운 현상을 더 잘 이해하는데 목적이 있다. 그동안 데이터베이스 연구 분야에서 수학적이고 공학적인 연구가 주류를 이루어 온데 반해, 데이터베이스 관리 시스템을 잘 이해할 수 있는 과학적인 연구는 다소 덜 주목 받아 왔다. 사실 과학적인 연구는 질의 최적화 및 트랜잭션 처리에 대한 더 깊은 이해를 이끌어 내어 궁극적으로 기존 데이터베이스 관리 시스템의 성능을 개선하는데 간접적으로 기여할 수 있다. 데이터베이스에 대한 과학 분야는 현재까지 서로 다른 데이터베이스 관리 시스템으로부터 관찰된 다수의 현상 사례들을 연구하고 발견된 결과를 토대로 다수의 공학적 함의를 제공해 왔다. 본 논문은 데이터베이스에 대한 과학적, 실증적 연구 방법론을 살펴보고, 이를 지원하는 사이버 인프라를 소개한다. 이어서 지금까지 다뤄진 현상 연구 사례들을 복개하고 각 현상의 설명을 위해 제안된 실증적으로 검증된 구조 인과 모델을 논의한다. 끝으로, 연구 사례들을 종합적으로 분석 한 후, 관심 연구자들을 위한 향후 연구 방향을 제시한다.