디지털 라이브러리[ 검색결과 ]
다변량 데이터의 피처 조합을 활용한 ConvLSTM 기반 COVID-19 확산 예측
http://doi.org/10.5626/JOK.2021.48.4.405
COVID-19는 감염자의 비말을 통해 전파된다. 비말의 전파는 시공간의 영향을 받는다. 전염병의 전파는 감염자와 비감염자의 건강 상태, 환경적 요인 등 다양한 요인의 상호작용으로 이루어진다. 하지만 예측 모델에 전염병과 관련된 정보를 모두 포함하고, 정보간의 관계를 파악하는 것은 쉽지 않다. 본 논문에서는 COVID-19의 전염 특징을 딥러닝 학습 데이터셋에 포함하고, COVID-19 확산 데이터의 조합이 딥러닝 예측 성능에 미치는 영향을 파악하는 연구 방법을 제안하였다. 예측에 앞서 COVID-19의 전염 특징을 파악하고, 데이터 전처리 시 COVID-19 확산 특징을 포함하기 위한 고려 사항을 정의하였다. 딥러닝 모델링 시에는 시공간 예측을 위해 ConvLSTM을 응용한 예측 모델을 설계하였다. 예측 모델을 테스트하는 단계에서는 확산 데이터를 여러 가지 방식으로 조합하고, 각 조합이 딥러닝 예측 성능에 미치는 영향을 분석하였다. 성능 평가를 위해 COVID-19 확진자의 정보와 확진자가 방문한 장소의 특징을 기준으로 47개의 피처를 만들고, 120개의 피처 조합을 실험하였다. 또한 모델 성능 평가 지표로 MAPE를 이용하였다. 실험 결과, COVID-19 데이터셋에서 피처 조합 모델의 MAPE 평균값으로 1.234, 피처를 조합하지 않은 모델의 MAPE 평균값으로 2.217을 얻을 수 있었다.
중력 모델을 이용한 시공간 데이터의 시각화
시공간 데이터는 위도와 경도를 비롯한 위치정보를 포함한 데이터를 일컫는 말로 지리학적 시각화의 연구로 시공간 데이터를 분석하고 표현하는 방법에 대한 다양한 연구가 진행되었다. 이 기술은 특정 공간에 시간을 두고 연속적 또는 이산적으로 발생하는 데이터로부터 패턴을 찾고 이를 분석하는 데 목표가 있다. 하지만, 이동 경로에 대한 정보가 없는 이산적인 시공간 데이터에서 데이터의 흐름을 시각화하는 것은 쉽지만은 않은 일이다. 본 논문에서는 커널밀도추정과 중력모델을 이용하여 이산적인 시공간 데이터로부터 벡터를 추출하고 이를 이용하여 사용자로 하여금 시공간 데이터에서 움직임과 경향을 분석할 수 있도록 시각화 하는 것에 목표를 두었다. 이를 뒷받침하기 위하여 트위터 데이터를 이용하여 이산적인 시공간 데이터를 시각화하고 분석하고자 한다.