디지털 라이브러리[ 검색결과 ]
다변량 데이터의 피처 조합을 활용한 ConvLSTM 기반 COVID-19 확산 예측
http://doi.org/10.5626/JOK.2021.48.4.405
COVID-19는 감염자의 비말을 통해 전파된다. 비말의 전파는 시공간의 영향을 받는다. 전염병의 전파는 감염자와 비감염자의 건강 상태, 환경적 요인 등 다양한 요인의 상호작용으로 이루어진다. 하지만 예측 모델에 전염병과 관련된 정보를 모두 포함하고, 정보간의 관계를 파악하는 것은 쉽지 않다. 본 논문에서는 COVID-19의 전염 특징을 딥러닝 학습 데이터셋에 포함하고, COVID-19 확산 데이터의 조합이 딥러닝 예측 성능에 미치는 영향을 파악하는 연구 방법을 제안하였다. 예측에 앞서 COVID-19의 전염 특징을 파악하고, 데이터 전처리 시 COVID-19 확산 특징을 포함하기 위한 고려 사항을 정의하였다. 딥러닝 모델링 시에는 시공간 예측을 위해 ConvLSTM을 응용한 예측 모델을 설계하였다. 예측 모델을 테스트하는 단계에서는 확산 데이터를 여러 가지 방식으로 조합하고, 각 조합이 딥러닝 예측 성능에 미치는 영향을 분석하였다. 성능 평가를 위해 COVID-19 확진자의 정보와 확진자가 방문한 장소의 특징을 기준으로 47개의 피처를 만들고, 120개의 피처 조합을 실험하였다. 또한 모델 성능 평가 지표로 MAPE를 이용하였다. 실험 결과, COVID-19 데이터셋에서 피처 조합 모델의 MAPE 평균값으로 1.234, 피처를 조합하지 않은 모델의 MAPE 평균값으로 2.217을 얻을 수 있었다.
최적 속성 할당을 이용한 효율적인 다중 속성 유사 레코드 검색 기법
http://doi.org/10.5626/JOK.2019.46.2.193
본 논문은 다중 속성 데이터로 구성된 레코드에 대한 유사 검색 문제를 다룬다. 데이터들 간의 유사도 측정에 사용되는 기존의 유사도 측정 함수들은 레코드의 각 속성들에 대한 유사성을 측정할 수 없으므로 정확한 결과를 얻기 어렵다. 이러한 문제점을 해결하기 위하여 본 논문은 레코드의 속성들에 대한 유사성을 고려하여 레코드 간의 유사성을 측정하는 레코드 유사도를 제안한다. 또한 주어진 레코드 유사도 임계값에 대한 질의의 후보를 효과적으로 생성하는 필터링 기법을 제안하며, 후보가 질의에 대한 답이 될 수 있는 지를 확인하는 효율적인 검증 기법을 제안한다. 그리고 실험을 통하여 제안하는 기법들이 정확하고 효율적으로 유사한 레코드들을 검색하는 것을 보인다.