검색 : [ keyword: 지식 그래프 ] (14)

경로 임베딩 기반 지식 그래프 완성 방식

바트셀렘, 김민성, 박영택

http://doi.org/10.5626/JOK.2020.47.8.722

지식 그래프는 질의응답 또는 추천시스템과 같은 지능형 시스템을 구성하는데 많이 사용된다. 그러나 지식 그래프에는 대부분의 엔티티들 사이에 관계 링크가 누락되어 있는 문제가 존재한다. 이런 문제를 해결하기 위해 본 논문에서 BLSTM(Bidirectional LSTM) 및 CNN(Convolutional Neural Network)을 결합한 새로운 지식 그래프 완성 방법을 제안한다. 우선, 후보 관계와 두개의 대상 엔티티가 주어지면 BLSTM 및 Convolution 연산을 사용하여 엔티티들을 연결하는 경로들을 저차원 공간으로 임베딩한다. 그리고 어텐션(attention) 모델을 통해 두 개의 엔티티를 표현하는 여러 경로들을 하나의 벡터로 만든다. 벡터와 추론할 후보 관계 사이의 연관성을 통해 후보 관계가 엔티티들과 연결될 수 있는지에 대한 가능성을 예측한다. 제안하는 방법은 CNN을 이용해서 주어진 엔티티들의 관계를 추론하기에 가장 중요한 지역특징(local feature)을 엔티티 사이에 있는 경로에서 추출하고 BLSTM을 이용해서 추출한 지역특징의 순서 관계에 대해 학습한다. 이를 통해 저차원 경로 특징을 효과적으로 학습 하는 것이 가능했으며, 학습된 특징들을 이용해 엔티티 사이의 관계를 예측하였다. 여러 지식 그래프를 대상으로 링크 예측(link prediction) 실험을 진행했으며, 제안하는 방법이 최신 연구 결과보다 높은 성능을 보였다.

다중 클래스 멤버쉽 처리를 위한 Bi-LSTM 기반 지식 그래프 완성 기법

노재승, 바트셀렘, 이완곤, 박영택

http://doi.org/10.5626/JOK.2020.47.6.559

실세계의 지식을 구조화된 방식으로 표현한 지식 그래프는 웹 검색, 추천 시스템과 같이 다양한 분야에서 활용되고 있지만, 엔티티 또는 엔티티 사이의 링크가 누락되는 문제가 존재한다. 이러한 문제해결을 위해 임베딩 기법을 사용하거나 딥러닝을 활용한 다양한 연구들이 진행되었으며, 특히 CNN과 Bidirectional-LSTM을 결합한 최신 연구가 기존 연구들과 비교하여 높은 성능을 나타냈다. 그러나 하나의 엔티티에 대하여 여러 개의 클래스 타입이 정의된 경우 학습 데이터의 양이 기하급수적으로 증대되어 학습시간이 증가하는 문제와 엔티티의 클래스 타입 정보가 정의되지 않으면 학습 데이터 생성이 불가능하다는 한계점이 존재한다. 따라서 본 논문에서는 엔티티의 클래스 타입 수에 상관없이 학습 데이터 생성과 모델에서 학습 및 추론이 가능하도록 미리 학습된 지식 그래프 임베딩 벡터를 사용하는 방법과 vector addition 개념을 활용한 다중 클래스 멤버쉽 처리 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해 데이터셋 NELL-995 와 FB15K-237을 대상으로 기존 지식 완성 연구들과 비교 실험을 진행하였으며 MAP이 1.6%p, MRR이 1.5%p 더 높은 성능을 보였다.

링크 추정을 위한 지식 그래프 임베딩 기반의 앙상블 모델

최수정, 박세영

http://doi.org/10.5626/JOK.2020.47.5.473

링크 추정은 개체 사이의 관계를 추정하는 문제로, 지식 베이스를 완전하게 만들기 위한 태스크 중 하나이다. 지식 베이스는 많은 개체와 관계들을 포함하고 있지만, 누락된 지식 트리플들이 존재하기 때문에 완전하지 않다. 누락된 지식 트리플들은 지식 베이스의 활용에 한계를 야기하기 때문에 누락된 관계 정보들을 찾아 지식 베이스를 완전하게 만들기 위해 본 논문은 링크 추정을 수행하고자 한다. 기존의 링크 추정을 위한 연구들은 주로 지식 그래프 임베딩을 활용하여 누락된 관계들을 찾았다. 하지만 임베딩된 벡터들은 정확성이 부족하기 때문에 hit@10에서는 좋은 성능을 보였지만, hit@1에서는 부족한 성능을 보여 주었다. 그러므로 하나의 지식 그래프 임베딩만을 사용하여 링크를 추정하는 것은 효과적이지 않으며, 지식 그래프 임베딩들은 각자의 관점을 가지고서 임베딩하기 때문에 이들을 함께 고려하는 것이 필요하다. 따라서 본 논문에서는 기존의 링크 추정의 성능을 높이기 위하여 지식 그래프 임베딩 기반의 앙상블 모델을 제안한다. 지식 그래프 임베딩 모델들은 각자의 관점 및 특성을 가지고 있기 때문에, 이들을 결합하면 다양한 관점들을 고려할 수 있다. WN18과 FB15K 데이터 셋으로 실험한 결과, 기존의 각 모델들보다 제안한 모델이 평균적으로 13.5% 높은 성능을 보여 주었다. 또한 사용자 파라미터에 기존 모델보다 강건한 결과를 보여 제안한 모델의 우수함을 증명하였다.

부분 임베딩 기반의 지식 완성 기법

이완곤, 바트셀렘, 홍지훈, 최현영, 박영택

http://doi.org/10.5626/JOK.2018.45.11.1168

지식 그래프는 실세계의 개체들과 개체 사이의 관계로 구성된 네트워크를 의미하며, 최근에는 대용량 데이터를 기반으로 구축되고 있다. 대부분의 지식 그래프들은 누락된 엔티티 또는 관계들로 인해 불완전성에 대한 문제점이 존재한다. 이를 해결하기 위해 지난 연구들은 지식 그래프를 다차원 공간상에 임베딩하는 방법을 적용했다. 그러나 이러한 연구들은 지식 그래프가 변화하지 않는다는 가정을 하고 있다. 이로 인해 새로운 트리플이 추가되어 빠르게 진화하는 실세계의 지식 그래프에 적용하기 위해 반복적인 임베딩 모델의 재학습은 고비용의 연산이 요구되며, 실용적이지 못하다. 따라서 본 논문에서는 변화하는 지식 그래프를 대상으로 하는 부분 임베딩 기반의 지식 완성 방법을 제안한다. 지식 완성의 대상이 되는 관심 관계들을 추출하기 위해 온톨로지의 공리와 문맥 정보를 활용했으며, 이를 기반으로 엔티티와 관계들을 임베딩하고 학습하여 지식 완성을 수행했다. 제안하는 방법의 성능을 측정하기 위해 Freebase와 WiseKB 데이터셋을 대상으로 최신 지식 완성 연구들과의 비교 실험을 진행하였고, 평균적으로 학습시간이 약 49%∼90% 감소했으며, 전체적인 성능이 약 6.7% 증가하는 것을 확인했다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr