검색 : [ author: 이기용 ] (5)

그래프 신경망 기반 딥 k-평균 노드 클러스터링

신혜수, 이기용

http://doi.org/10.5626/JOK.2023.50.12.1153

최근 그래프 신경망(graph neural network, GNN)을 사용한 그래프 노드 클러스터링(node clustering) 기법들이 활발히 연구되고 있다. 이들 연구 대부분은 GNN으로 노드들을 저차원 벡터들로 임베딩(embedding)한 뒤, 이 임베딩 벡터들을 기존의 클러스터링 알고리즘으로 클러스터링한다. 하지만 이 방식은 GNN을 훈련시킬 때 클러스터링이라는 최종 목표를 전혀 고려하지 않기 때문에 최적의 클러스터링 결과를 낸다고 보기 어렵다. 따라서 본 논문은 k-평균 클러스터링이라는 최종 목표를 고려하여 GNN을 반복적으로 훈련시키고 그 결과로 얻어진 노드들의 임베딩 벡터들로 노드들을 k-평균 클러스터링하는 딥 k-평균 클러스터링 기법을 제안한다. 제안 방법은 GNN을 훈련시킬 때 노드들의 유사도뿐만 아니라 k-평균 클러스터링의 손실까지 고려한다. 실데이터를 사용한 실험 결과 제안 방법은 기존 방법에 비해 k-평균 클러스터링 결과의 품질을 향상함을 확인하였다.

원소들의 발생 순서와 시간 간격을 모두 고려하는 효과적인 이상 시퀀스 탐지 기법

이주연, 이기용

http://doi.org/10.5626/JOK.2021.48.4.469

최근 다양한 응용에서 시간의 흐름에 따라 관측된 원소들로 구성된 시퀀스 데이터가 활발하게 생성되고 있다. 주어진 시퀀스들 중에서 이상(anomalous) 시퀀스를 탐지하는 기법들은 활발히 연구되어 왔으나 이들 대부분은 주로 원소들의 발생 순서들만을 고려한다. 본 논문에서는 원소들의 발생 순서뿐만이 아니라 원소들 사이의 시간 간격까지 고려한 효과적인 이상 시퀀스 탐지 기법을 제안한다. 이를 위해 제안 방법은 두 개의 오토인코더를 결합한 모델을 사용한다. 첫 번째는 LSTM 오토인코더로서 원소들의 발생 순서에 대한 특징을 학습하며, 두 번째는 그래프 오토인코더로서 원소들 간 시간 간격에 대한 특징을 학습한다. 학습이 완료되면 각 시퀀스를 학습된 모델에 입력하여 모델이 복원한 원소들의 발생 순서 및 원소들 간의 시간 간격이 원 시퀀스와 차이가 큰 시퀀스를 이상 시퀀스로 판단한다. 본 논문에서는 가상데이터를 사용한 다양한 실험을 통해 제안 방법이 RNN 오토인코더로 학습하는 방법 및 단일 LSTM 오토인코더만을 사용하는 방법 그리고 딥러닝을 사용하지 않는 방법보다 효과적으로 이상 시퀀스를 탐지함을 확인하였다.

LSTM 오토인코더를 이용한 가중 그래프 임베딩 기법

서민지, 이기용

http://doi.org/10.5626/JOK.2021.48.1.13

그래프 임베딩이란 그래프를 저차원 공간의 벡터로 표현하는 것이다. 최근, 딥러닝을 사용해 그래프를 임베딩하는 연구가 진행되고 있지만 대부분의 연구는 그래프의 노드 간 연결 구조에 집중하고 노드간 간선에 임의의 가중치를 갖는 가중 그래프에 대한 임베딩 기법에 대해서 많은 연구가 진행되지 않았다. 따라서 본 논문에서는 가중 그래프를 위한 새로운 임베딩 기법을 제안한다. 제안 기법은 가중 그래프가 주어지면 먼저 해당 그래프의 내부에 존재하는 노드-가중치 시퀀스들을 추출한 다음 LSTM 오토인코더를 사용해 각 시퀀스들을 고정된 길이의 벡터로 인코딩한다. 마지막으로 각 그래프의 인코딩 벡터들을 모아 하나의 최종 임베딩 벡터를 생성한다. 이렇게 얻어진 임베딩 벡터는 가중 그래프간 유사도 측정이나 분류 등에 활용될 수 있다. 여러 유사 가중 그래프 그룹들로 구성된 합성 데이터와 실제 데이터를 이용한 실험을 통해 제안 기법이 유사 가중 그래프를 탐색하는데 94% 이상의 정확도를 보임을 확인하였다.

상품들의 계층적 분류체계를 고려한 구매 이력 간 효율적인 유사도 측정

양유정, 이기용

http://doi.org/10.5626/JOK.2020.47.10.999

온라인 쇼핑몰 또는 오프라인 매장에서 각 고객이 구매한 상품들은 시간의 흐름에 따라 해당고객의 구매 이력을 형성한다. 또한 대부분의 경우 상품들에는 그들의 세부 분류를 나타내는 계층적 분류체계가 존재한다. 본 논문에서는 상품들의 구매 순서뿐만 아니라 상품들에 존재하는 계층적 분류체계까지 고려하는 새로운 구매 이력 간 유사도 측정 방법을 제안한다. 제안 방법은 기존의 대표적인 시퀀스 간 유사도 측정 방법인 동적 타임 워핑(dynamic time warping) 유사도를 상품들의 계층적 분류체계를 반영하도록 확장하였다. 제안 방법은 두 시퀀스 내 원소들을 비교할 때 원소들의 일치 여부에 따라 원소들 간의 유사도를 0 또는 1로만 부여하던 기존 방법과 달리 계층적 분류체계를 반영하여 0에서 1 사이의 실수 값을 부여한다. 이와 함께 본 논문은 제안하는 유사도 측정 방법에 대한 효율적인 계산 기법을 제안한다. 제안하는 계산 기법은 세그먼트 트리(segment tree)를 사용하여 계층적 분류체계 내에서 두 상품 간의 유사도를 매우 빠르게 계산한다. 본 논문에서는 실데이터에 기반한 다양한 실험을 통해 제안 방법이 계층적 분류체계가 존재하는 상품들의 구매 이력 간 유사도를 매우 효과적이고 빠르게 측정할 수 있음을 보인다.

IoT 환경에서의 시공간 조인의 효율적 처리 기법

이기용, 서민지, 이용, 박민우, 이상환

http://doi.org/10.5626/JOK.2019.46.1.86

시공간 조인은 서로 다른 릴레이션의 데이터 중 서로 동일한 시간과 동일한 위치 값을 가지는 데이터를 결합하는 연산이다. 특히 최근 IoT의 보급과 함께 서로 다른 사물들이 과거에 발생시킨 데이터 중 동일한 시간에 동일한 위치에서 발생된 데이터를 검색하기 위해 시공간 조인의 필요성이 증가하고 있다. 본 논문에서는 둘 이상의 사물들이 발생시킨 데이터를 효율적으로 시공간 조인하는 기법을 제안한다. 제안 방법은 평면과 시간으로 이루어진 3차원 시공간을 작은 부분 공간들로 나누고, 각 부분 공간 별로 그 내부에 데이터가 존재하는 사물들을 기록한다. 사물들 간 시공간 조인이 요청되면, 제안 방법은 해당 사물들의 데이터가 서로 가까이 존재하는 공간들을 탐색한다. 그 후 탐색된 공간 내에 존재하는 데이터만을 가져와서 조인을 수행한다. 따라서 제안 방법은 서로 조인 가능성이 있는 데이터만을 접근하므로 수행비용이 크게 감소한다. 실제 사물 데이터로 성능을 측정한 결과 제안 방법은 기존 시공간 조인 방법에 비해 수행 시간을 크게 단축함을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr