검색 : [ author: Sung-Hyuk Bang ] (3)

생활 패턴 인지를 위한 이벤트 연산 기반 예측 모델 학습 기법

배석현, 방성혁, 박현규, 전명중, 김제민, 박영택

http://doi.org/10.5626/JOK.2018.45.5.466

기계 학습 알고리즘의 발전에 따라 다양한 영역의 데이터에 대한 분석 및 결과를 예측하는 연구들이 진행되고 있다. 그러나 기존의 데이터 의존적인 기계 학습 기반의 의도 인지 방법론은 노이즈 처리에 대한 어려움이 존재하고, 복합적으로 발생할 수 있는 행위 의도에 대한 인지에서 한계점을 가진다. 본 한계점을 극복하기 위해 본 논문에서는 이벤트 연산(Event Calculus)을 기반으로 3단계의 행위 의도인지 방법론을 제안한다. 첫 번째 단계는 시퀀스 데이터가 어떤 의도인지를 판별하는 의도 추론 단계이다. 두 번째 단계는 새롭게 추론된 행위 의도를 기반으로 이전부터 유지됐던 행위 의도와의 병행 가능 여부를 판단하는 충돌 해결(Conflict Resolution) 단계이다. 마지막으로 많은 노이즈로 인해 발생되는 오류를 추론된 행위 의도들에 반영하는 노이즈 감소(Noise Reduction) 단계로 진행된다. 이벤트 연산 기법에 대한 성능 평가를 위해 실제 수집한 데이터를 재구축한 혼합 가우시안 모델과 휴리스틱 규칙 기반의 범용 데이터 생성 기법을 제안한다. 5개의 의도로 이루어진 약 13시간의 시퀀스 데이터 300개를 사용하여 이벤트 연산의 성능을 측정하였고, 각 의도에 대해 이벤트 연산의 예측 결과와 실제 확률 모델이 평균 89.3%의 일치
도를 보였다.

순환신경망 기반의 사용자 의도 예측 모델

방성혁, 배석현, 박현규, 전명중, 김제민, 박영택

http://doi.org/10.5626/JOK.2018.45.4.360

기계 학습 모델 구축을 통한 인간의 의도 예측은 기존에도 제공되어 왔으나, 특정 행위가 발생하는 시점으로부터 먼 과거의 정보를 반영한 의도 예측이 어렵다는 단점이 존재했다. 이 문제점의 극복을 위해, 본 논문에서는 순환 신경망(RNN – Recurrent Neural Network) 기반의 행위 의도 예측 모델 학습 기법을 제안한다. 순환 신경망 모델은 시계열(Time-Series) 데이터의 패턴을 분석하여 과거의 시점이 반영된 예측 결과를 생성한다. 본 논문이 제안하는 순환 신경망 기반의 의도 예측 모델은 시간, 공간, 행위, 물체, 의도로 구성된 생활 데이터 시퀀스를 바탕으로 사용자의 의도를 예측할 수 있도록 학습된다. 순환 신경망의 각 노드는 의도 예측 모델이 먼 과거의 데이터 시퀀스를 고려하여 의도를 예측 할 수 있도록 LSTM(Long-Short Term Memory) Cell로 구성하였다. 순환 신경망 기반의 의도 예측 모델의 성능 평가를 위해, 본 논문에서는 행위 의도에 대한 가중치 그래프 기반 데이터 생성기를 구축하여 실제 실내에서 발생하는 인간 활동에 가까운 데이터를 자동으로 생성하여 실험에 사용했다. 총 23,000개의 데이터가 의도 모델 학습과 검증에 사용되었으며, 학습된 모델의 의도 예측 정확도 측정 실험을 한 결과로 평균 90.52%의 예측 정확도를 보였다.

분산 처리 환경에서 SWRL 규칙을 이용한 대용량 점증적 추론 방법

이완곤, 방성혁, 박영택

http://doi.org/

빅데이터 시대가 도래 하면서 시맨틱 데이터의 양이 빠른 속도로 증가하고 있다. 이러한 대용량 시맨틱 데이터에서 의미 있는 암묵적 정보를 추론하기 위해서 지식 사용자의 경험적 지식을 기반으로 작성된 SWRL(Semantic Web Rule Language) 규칙들을 활용하는 많은 연구가 진행되고 있다. 그러나 기존의 단일 노드의 추론 시스템들은 대용량 데이터 처리에 한계가 있고, 다중 노드 기반의 분산 추론 시스템들은 네트워크 셔플링으로 인해 성능이 저하되는 문제점들이 존재한다. 따라서 본 논문에서는 기존 시스템들의 한계를 극복하고 보다 효율적인 분산 추론 방법을 제안한다. 또한 네트워크 셔플링을 최소화 할 수 있는 데이터 파티셔닝 전략을 소개하고, 점증적 추론에서 사용되는 추가된 새로운 데이터의 선별과 추론 규칙의 순서결정으로 추론 과정을 최적화 할 수 있는 방법에 대해 설명한다. 제안하는 방법의 성능을 측적하기 위해 약2억 트리플로 구성된 WiseKB 온톨로지와 84개의 사용자 정의 규칙을 이용한 실험에서 32.7분이 소요되었다. 또한 LUBM 벤치 마크 데이터를 이용한 실험에서 맵-리듀스 방식에 비해 최대 2배 높은 성능을 보였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr