디지털 라이브러리[ 검색결과 ]
뉴로 심볼릭 기반 규칙 생성을 통한 지식 완성 기법
http://doi.org/10.5626/JOK.2021.48.4.425
지식 그래프는 실세계의 지식을 다양한 소스로부터 수집하여 구조화된 방식으로 표현한 것이다. 지식 그래프는 데이터들 간의 관계를 표현한 네트워크로서 인공지능 기술에 접목되어 다양하게 활용되고 있지만, 엔티티 또는 엔티티 사이의 링크가 누락되어 지식의 불완전성에 대한 문제가 존재한다. 이러한 문제 해결을 위해 자동 지식 완성 기법 연구가 중요하게 요구되며, 임베딩 기법을 사용하거나 딥러닝을 활용한 연구와 온톨로지를 이용한 심볼릭 규칙 추론을 통한 지식 완성 수행과 같은 다양한 연구들이 진행되었다. 이러한 방식을 통해 효율적으로 자동 지식 완성을 수행하지만 딥러닝 방식은 데이터 기반의 처리방식으로 인해 대량의 학습 데이터가 요구되며, 결과에 대한 설명이 불가능한 문제점이 있다. 그리고 온톨로지 기반의 방식은 전문가에 의해 정의된 온톨로지 및 규칙이 필요하다는 문제가 존재한다. 따라서 본 논문에서는 뉴로 심볼릭 방식을 이용하여 데이터에 내포된 규칙을 명시적으로 추출하여 자동 지식 완성방법을 제안한다. 규칙 추출을 위해 심볼릭 방식의 단일화(unification) 기반의 릴레이션 임베딩 경로를 구현하고, 이에 대한 손실 함수를 정의하여 자동으로 규칙을 생성한다. 기존의 임베딩 기법에 비하여 뉴로 심볼릭 방식은 속도와 성능이 더 우월함을 보여준다. 제안하는 방법의 성능을 측정하기 위해 Nations, UMLS, Kinship 데이터 셋을 대상으로 최신 지식 완성 연구와 비교 실험을 진행하였으며, 학습 시간이 크게 감소했고, 평균적으로 성능이 37.5%p 증가한 것을 확인하였다.
이종 그래프상의 비유클리디안 데이터 분석을 위한 쌍곡 그래프 변형 인공 신경망
http://doi.org/10.5626/JOK.2021.48.2.217
합성곱 기반인 합성곱 인공 신경망(CNNs)은 이미지 분류, 이미지 생성, 시계열 분석 등에 다양하게 쓰이고 있다. 하지만 일반적인 유클리디안 공간과는 달리 그래프와 같은 비유클리디안 공간에서는 합성곱을 바로 적용할 수 없다. 이를 극복하기 위해 다양한 기법으로 합성곱을 그래프 상으로 확장하였으며, 다양한 그래프 인공 신경망(GNNs)이 제안되어 왔다. 하지만 기존의 그래프 인공 신경망 연구는 간선의 타입이 하나인 동종 그래프 분석에 국한되어 있는데 반해, 현실의 데이터는 간선의 타입이 많은 이종그래프 데이터인 경우가 많기 때문에 이를 기존의 그래프 인공 신경망으로 해결하려 하면 큰 왜곡이 생기게 된다. 본 연구는 계층적 구조를 가진 이종 그래프 데이터를 효과적으로 다루기 위하여 그래프 변형 네트워크(GTNs) 모델과 쌍곡 그래프 합성곱 네트워크(HGCNs) 모델을 통합하여 새로운 모델인 쌍곡 그래프 변형 네트워크(HGTNs)를 제안한다.
LSTM 오토인코더를 이용한 가중 그래프 임베딩 기법
http://doi.org/10.5626/JOK.2021.48.1.13
그래프 임베딩이란 그래프를 저차원 공간의 벡터로 표현하는 것이다. 최근, 딥러닝을 사용해 그래프를 임베딩하는 연구가 진행되고 있지만 대부분의 연구는 그래프의 노드 간 연결 구조에 집중하고 노드간 간선에 임의의 가중치를 갖는 가중 그래프에 대한 임베딩 기법에 대해서 많은 연구가 진행되지 않았다. 따라서 본 논문에서는 가중 그래프를 위한 새로운 임베딩 기법을 제안한다. 제안 기법은 가중 그래프가 주어지면 먼저 해당 그래프의 내부에 존재하는 노드-가중치 시퀀스들을 추출한 다음 LSTM 오토인코더를 사용해 각 시퀀스들을 고정된 길이의 벡터로 인코딩한다. 마지막으로 각 그래프의 인코딩 벡터들을 모아 하나의 최종 임베딩 벡터를 생성한다. 이렇게 얻어진 임베딩 벡터는 가중 그래프간 유사도 측정이나 분류 등에 활용될 수 있다. 여러 유사 가중 그래프 그룹들로 구성된 합성 데이터와 실제 데이터를 이용한 실험을 통해 제안 기법이 유사 가중 그래프를 탐색하는데 94% 이상의 정확도를 보임을 확인하였다.
문장 랭킹 스코어와 그래프 기법을 사용한 질의 기반 생성 요약 모델
http://doi.org/10.5626/JOK.2020.47.12.1172
기본적인 생성 요약 모델은 문서 내 모든 중요 내용을 포함하는 짧은 요약문을 생성하는 것을 목표로 한다. 반면, 질의(Query) 기반 생성 요약 모델의 경우 문서 내에서 질의와 관련된 정보를 요약해야 한다. 기존의 질의 기반 요약 모델은 문서 내 단어들과 질의문 간의 어텐션(Attention) 메커니즘을 통해 단어의 가중치를 계산하고 이를 기반으로 문장의 중요도를 계산한다. 이러한 방식은 문서의 전체적인 문맥정보를 반영하기 어렵다는 단점이 있다. 본 논문에서는 이러한 문제를 문장 랭킹 스코어와 문장 단위 그래프 구조를 만들어 문장의 중요도뿐만 아니라 문맥 정보를 반영하여 생성 요약의 성능을 향상시킬 수 있는 새로운 생성 요약 기법을 제안한다. 실험으로 살펴본 최종 제안 모델의 성능은 같은 데이터를 사용하는 선행 모델 대비 ROUGE-1 1.44%p, ROUGE-L 0.52%p의 향상된 성능을 보인다.
지식 그래프 임베딩 및 적응형 클러스터링을 활용한 오류 트리플 검출
http://doi.org/10.5626/JOK.2020.47.10.958
최근 인터넷의 발전으로 정보의 양이 늘어나면서 대용량 지식 그래프를 이용한 연구가 활발히 이루어지고 있다. 또한 지식 그래프가 다양한 연구와 서비스에 활용됨에 따라 양질의 지식 그래프를 확보해야 하는 필요성이 대두되고 있다. 하지만 양질의 지식 그래프를 얻기 위해 지식 그래프 내 오류를 검출하는 연구가 부족하다. 오류 트리플 검출을 위해 임베딩과 클러스터링을 사용한 이전 연구가 좋은 성능을 나타냈다. 하지만 클러스터 최적화 과정에서 일괄적으로 동일한 임계값을 사용하여 각 클러스터의 특성을 고려하지 못하는 문제가 존재하였다. 본 논문에서는 이러한 문제를 해결하고자 지식 그래프 내 오류 트리플 검출을 위해 지식 그래프에 대한 임베딩과 함께 각 클러스터에 대한 최적의 Threshold를 찾아 적용함으로써 클러스터링을 진행하는 적응형 클러스터링 모델을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해 DBpeida, Freebase와 WiseKB 세 가지 데이터셋을 대상으로 기존 오류 트리플 검출 연구와 비교 실험을 진행하였으며 F1-Score를 기준으로 평균 5.3% 높은 성능을 확인하였다.
증강 현실 환경에서 실제 물체의 물리적 속성을 활용한 디지털 사진 관리에 대한 연구
http://doi.org/10.5626/JOK.2020.47.10.900
본 논문에서는 증강 현실 환경에서 실제 물체의 물리적 속성을 활용하여 자연스러운 사용자 경험을 제공하는 Physical-Object-Oriented Interaction의 개념과 그 개념 아래에서 기존의 디지털 사진경험을 확장하고, 다양한 형태의 tangible한 사진 컬렉션을 만들고 소장할 수 있도록 디자인 된 증강 현실 인터페이스(ARphy)를 소개한다. 기존 모바일 사진 앱들과는 달리, ARphy는 실제 물체의 물리적 속성 및 affordance를 적극 활용하여 직관적인 사용을 가능케 한다. 예를 들어, 여행 사진을 기념품과 함께 장식할 수 있고, 의미 있는 사진을 상자에 보관할 수 있으며, 지우고 싶은 사진을 휴지통에 직접 버릴 수 있다. 모바일 및 헤드셋을 포함한 다양한 형태의 증강 현실 기기에서 사용 가능하도록 인터페이스를 설계하였고, 일상적으로 쉽게 접할 수 있는 6개 사물에 대하여 인터액션을 디자인 하고 프로토타입을 개발하였다. 사용자 실험을 통해 본 인터페이스의 실효성을 검증하였으며, 새로운 증강 현실 사진 인터페이스로서의 가능성을 보였다.
시각-언어 공동 임베딩과 지식 그래프 임베딩을 이용한 영상 기반 상식 추론
http://doi.org/10.5626/JOK.2020.47.10.985
본 논문에서는 영상 기반 상식 추론(VCR) 작업을 위한 새로운 모델을 제안한다. 제안 모델에서는 영상과 자연어 질문, 답변 리스트 등과 같은 멀티 모달 입력 데이터들 간의 상호 정렬을 요구하는 시각적 접지 문제에 효과적으로 대응하기 위해, 사전 학습된 시각-언어 모델에 시각적 바인딩 모듈을 추가하여 이들을 함께 임베딩한다. 또한, 제안 모델은 영상 기반 상식 추론에 필요한 공통 개념지식들을 공개 지식 베이스인 ConceptNet에서 추출하여 그래프 합성곱 신경망(GCN)을 이용해 임베딩한다. 본 논문에서는 제안 모델인 VLKG_VCR의 세부 설계사항들을 소개하고, 증진된 VCR 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해 제안 모델의 성능을 입증한다.
지식 그래프를 이용한 오픈 도메인 질문 응답
http://doi.org/10.5626/JOK.2020.47.9.853
본 논문에서는 오픈 도메인의 복잡한 질문들에 효과적으로 응답하기 위한 새로운 지식 그래프 추론 모델 KGNet을 제안한다. 본 모델에서는 질문 응답에 이용할 지식 베이스의 불완전성 문제에 주목한다. 이를 위해 본 모델에서는 서로 다른 형태의 두 가지 지식 자원인 지식 베이스와 문서 집합 모두를 하나의 지식 그래프로 통합하여 답변 생성에 활용한다. 또한 본 모델에서는 지식 그래프 상에서 복잡한 멀티 홉 질문들에 관한 답변을 보다 효과적으로 유도해내기 위해, 그래프 신경망을 이용한 새로운 지식 임베딩과 추론 기법을 적용한다. 본 논문에서는 대표적인 질문 응답 벤치마크 데이터 집합인 WebQuestionsSP와 MetaQA를 이용한 다양한 실험들을 통해, 제안 모델의 효과와 우수성을 입증한다.
경로 임베딩 기반 지식 그래프 완성 방식
http://doi.org/10.5626/JOK.2020.47.8.722
지식 그래프는 질의응답 또는 추천시스템과 같은 지능형 시스템을 구성하는데 많이 사용된다. 그러나 지식 그래프에는 대부분의 엔티티들 사이에 관계 링크가 누락되어 있는 문제가 존재한다. 이런 문제를 해결하기 위해 본 논문에서 BLSTM(Bidirectional LSTM) 및 CNN(Convolutional Neural Network)을 결합한 새로운 지식 그래프 완성 방법을 제안한다. 우선, 후보 관계와 두개의 대상 엔티티가 주어지면 BLSTM 및 Convolution 연산을 사용하여 엔티티들을 연결하는 경로들을 저차원 공간으로 임베딩한다. 그리고 어텐션(attention) 모델을 통해 두 개의 엔티티를 표현하는 여러 경로들을 하나의 벡터로 만든다. 벡터와 추론할 후보 관계 사이의 연관성을 통해 후보 관계가 엔티티들과 연결될 수 있는지에 대한 가능성을 예측한다. 제안하는 방법은 CNN을 이용해서 주어진 엔티티들의 관계를 추론하기에 가장 중요한 지역특징(local feature)을 엔티티 사이에 있는 경로에서 추출하고 BLSTM을 이용해서 추출한 지역특징의 순서 관계에 대해 학습한다. 이를 통해 저차원 경로 특징을 효과적으로 학습 하는 것이 가능했으며, 학습된 특징들을 이용해 엔티티 사이의 관계를 예측하였다. 여러 지식 그래프를 대상으로 링크 예측(link prediction) 실험을 진행했으며, 제안하는 방법이 최신 연구 결과보다 높은 성능을 보였다.
DPESS: 임베딩 공간 통계를 이용한 주간 위성 이미지 기반의 인구 통계학적 속성 예측
http://doi.org/10.5626/JOK.2020.47.8.742
위성 이미지를 이용하여 사회 경제적 지표로 활용되는 인구 통계를 예측하거나 분석하는 연구가 활발히 진행되고 있다. 본 연구에서는 심층 신경망 모델을 기반으로 주간 위성 이미지를 이용하여 특정 지역의 인구 통계학적 속성 값을 예측하기 위한 새로운 접근법을 제시한다. 총 4단계로 이루어진 DPESS 모델은 정보의 손실 없이 많은 수의 입력 위성 이미지를 고정 길이의 벡터로 요약한다. 이는 전이 학습 및 임베딩 공간 통계와 같은 고유한 기술로 인해 가능하다. 연구 결과, 인구 밀도(R² =0.94), 15-29세 그룹 인구수(0.80), 고등학교 졸업 인구수(0.79), 가구당 총 구매력(0.80)과 같은 다양한 인구 통계학적 요소 값을 위성 이미지만으로도 효과적으로 예측할 수 있다. 한편, 본 연구를 다른 국가에 적용하기 위해서는 추가적인 연구가 필요할 것으로 사료된다.