디지털 라이브러리[ 검색결과 ]
온톨로지와 CNN 기반의 무인기와 주변 개체 간 위협 관계 추론
http://doi.org/10.5626/JOK.2020.47.4.404
무인기 스스로 주변 개체와의 관계를 파악하고 상황을 인지하는 기술은 다양한 분야에서 필요로 하는 기술이다. 이를 위해 다양한 방법이 연구되고 있다. 대부분의 연구는 관련 도메인의 지식을 온톨로지로 구축하고 이를 기반으로 지식 추론하는 방식으로 해결하고 있다. 하지만 이러한 방식은 관련 도메인 지식을 가진 전문가의 의존성 때문에 전문가의 부재 시, 새로운 상황에 대해 대처할 지식을 구축하기가 어렵다. 또한 전문가가 고려하지 못한 상황을 추론하기 위한 지식을 구축하기가 어렵다. 그래서 본 연구에서는 이와 같은 문제를 해결하기 위해 온톨로지와 CNN을 이용하여 무인기와 주변 개체 간의 관계를 추론하기 위한 모델을 구축하는 방식을 제안한다. 온톨로지 추론의 정확도는 부족하다는 가정에서 감지된 주변 개체들의 정보를 활용하여 온톨로지 추론을 먼저 수행한다. 그리고 온톨로지 추론 결과는 CNN을 사용하여 보정한다. 실제 데이터 확보의 한계로 인해 데이터 생성기를 구축하여 실 데이터와 유사한 데이터를 생성하였다. 본 연구의 평가를 위해 2가지 개체 간 관계에 대한 모델을 구축하여 평가하였으며 두 관계 모델 모두 90% 이상의 정확도를 보였다.
온톨로지 기반 무인기의 자율 위협 상황 인지 시스템
http://doi.org/10.5626/JOK.2019.46.10.1044
무인기의 자율적인 위협 상황 인지는 다양한 분야에서 필요한 기술이다. 이를 위해 다양한 접근 방식이 제안되었지만 대부분은 개체의 의미 정보를 추론하기 위한 방식이다. 따라서 본 연구에서는 기존 개체의 의미적 정보를 기반으로 개체 간 관계 추론을 통해 무인기의 위협 상황을 인지할 수 있는 방법을 제안한다. 본 연구에서는 크게 3가지 방법을 통해 UAV의 위협 상황을 인지한다. 첫 번째로 LOD기반 그리드 맵을 사용하여 인지된 의미적 개체의 정보를 표현한다. 두 번째로 무인기 주변 개체들에 대한 개념들을 온톨로지로 정의하고 개체 간 관계 및 상황은 SWRL로 정의한다. 세 번째로 온톨로지 추론을 통하여 개체 간 관계 및 무인기의 위협 상황을 인지하고 시뮬레이터 시스템을 구축하여 이를 시각화한다.
대용량 데이터 기반 SPARQL 질의결과에 대한 통합 설명 시스템
http://doi.org/10.5626/JOK.2018.45.10.1004
최근 다양한 QA시스템 및 전문가 시스템에서 질의 결과에 대한 설명을 필요로 하는 요구가 증대되고 있다. 하지만 현재 연구되는 시스템에서는 대용량 기반의 질의 처리에만 중점을 두고 있다. 따라서 본 논문에서는 대용량 데이터 기반 질의 결과에 대한 인과 관계를 설명할 수 있는 통합 시스템을 제안한다. 본 시스템은 대용량의 지식에 대한 추론을 위해 분산 규칙 기반 SWRL엔진을 사용한다. 그리고 그 추론 근거를 인과 관계에 대한 구조로 표현할 수 있는 분산 가정기반 진리 관리 시스템(Distributed ATMS)의 입력으로 사용한다. 마지막으로 대용량 데이터 기반의 SPARQL 처리기인 SPARQLGX를 사용하여 질의 해답을 구하고 그 해답에 대한 인과 관계를 앞서 구축된 의존 구조를 참조하여 설명한다. 제안한 통합 설명 시스템에 대한 평가는 벤치마크 데이터인 LUBM(Lehigh University Benchmark)을 사용했으며, LUBM에서 제공한 14개의 테스트 질의문을 사용하여 질의 응답 시간 및 설명 시간에 대한 성능 평가를 하였다.
SparQLing : SparkSQL 기반 대용량 트리플 데이터를 위한 SPARQL 질의 시스템 구축
매년 RDFS 데이터는 대용량화 되어 가며, 빠른 질의를 위한 SPARQL 처리방식에 대한 변화가 필요하게 되었다. 이를 위해 대용량 분산 처리 프레임워크를 활용한 SPARQL의 질의 처리방식이 많이 연구되고 있다. 기존의 연구 중 대용량 분산 처리 프레임워크인 Hadoop(MapReduce) 기반 질의 엔진은 반복적인 작업으로 인한 잦은 I/O 발생으로 실시간 질의 처리가 불가능하며, 인메모리 기반 분산 질의 엔진 역시 낮은 단계의 언어 수준에서 분산 구조를 고려한 구현이 필요하기 때문에 질의 엔진 구축이 어렵다. 본 논문에서는 인메모리 기반 분산 질의 처리 프레임워크인 SparkSQL을 활용하여 대용량 트리플 데이터에 대한 SPARQL 질의문 처리 속도를 향상시킬 수 있는 질의 처리 엔진 구축 방법을 제안한다. SparkSQL 은 Spark 기반의 고수준 분산 질의 엔진으로서 기존의 SQL문을 활용한 질의가 가능하다. 따라서 SPARQL 질의문을 처리하기 위해서는 Jena를 이용하여 Algebra Tree를 생성한 후 이를 Spark 시스템에 적용하기 위한 Spark Algebra Tree로 변환해야 한다. 그리고 이를 이용하여 SparkSQL 질의문을 생성하는 시스템을 구축하였다. 또한 Spark 인메모리 시스템에서 보다 효율적인 질의 처리를 위한 DataFrame기반의 트리플 Property 테이블 설계를 제안하고 SparkSQL 프레임워크에 활용하였다. 마지막으로 기존의 분산처리 프레임워크를 사용한 질의 엔진과 비교 평가를 통하여 연구의 타당성을 검증한다.
GPU 클러스터 기반 대용량 온톨로지 추론
근래에 들어 다양한 시멘틱 서비스를 위하여 기존의 지식을 바탕으로 새로운 지식을 고속으로 추론할 수 있는 대용량 온톨로지 추론 기법이 요구되고 있다. 이런 추세에 따라 대규모의 클러스터를 활용하는 하둡 및 Spark 프레임워크 기반의 온톨로지 추론 엔진 개발이 연구되고 있다. 또한, 기존의 CPU에 비해 많은 코어로 구성되어 있는 GPGPU를 활용하는 병렬 프로그래밍 방식도 온톨로지 추론에 활용되고 있다. 앞서 말한 두 가지 방식의 장점을 결합하여, 본 논문에서는 RDFS 대용량 온톨로지 데이터를 인-메모리 기반 프레임워크인 Spark를 통해 분산시키고 GPGPU를 이용하여 분산된 데이터를 고속 추론하는 방법을 제안한다. GPGPU를 통한 온톨로지 추론은 기존의 추론 방식보다 저비용으로 고속 추론을 수행하는 것이 가능하다. 또한 Spark 클러스터의 각 노드를 통하여 대용량 온톨로지 데이터에 대한 부하를 줄일 수 있다. 본 논문에서 제안하는 추론 엔진을 평가하기 위하여 LUBM10, 50, 100, 120에 대해 추론 속도를 실험하였고, 최대 데이터인 LUBM120(약 1백7십만 트리플, 2.1GB)의 실험 결과, 인-메모리(Spark) 추론 엔진 보다 7배 빠른 추론 성능을 보였다.
인메모리 기반 병렬 컴퓨팅 그래프 구조를 이용한 대용량 RDFS 추론
전명중, 소치승, 바트셀렘, 김강필, 김진, 홍진영, 박영택
근래에 들어 풍부한 지식베이스를 구축하기 위한 대용량 RDFS 추론에 대한 관심이 높아지면서 기존의 단일 머신으로는 대용량 데이터의 추론 성능을 향상시키기에 한계가 있다. 그래서 분산 환경에서 의 RDFS 추론 엔진 개발이 활발히 연구되고 있다. 하지만 기존의 분산 환경 엔진은 실시간 처리가 불가능 하며 구현이 어렵고 반복 작업에 취약하다. 본 논문에서는 이러한 문제를 극복하기 위해 병렬 그래프 구조 를 사용한 인-메모리 분산 추론 엔진 구축 방법을 제안한다. 트리플 형태의 온톨로지는 기본적으로 그래프 구조를 가지고 있으므로 그래프 구조 기반의 추론 엔진을 설계하는 것이 직관적이다. 또한 그래프 구조를 활용하는 오퍼레이터를 활용하여 RDFS 추론 규칙을 구현함으로써 기존의 데이터 관점과 달리 그래프 구조의 관점에서 설계할 수 있다. 본 논문에서 제안한 추론 엔진을 평가하기 위해 LUBM1000(1억 3천 3백만 트리플, 17.9GB), LUBM3000(4억 1천 3백만 트리플, 54.3GB)에 대해 추론 속도를 실험을 하였으며 실 험결과, 비-인메모리 분산 추론 엔진보다 약 10배 정도 빠른 추론 성능을 보였다.
사물인터넷 환경에서 대용량 스트리밍 센서데이터의 실시간 · 병렬 시맨틱 변환 기법
최근 사물인터넷 환경에서는 발생하는 센서데이터의 가치와 데이터의 상호운용성을 증진시키기 위해 시맨틱웹 기술과의 접목에 대한 연구가 활발히 진행되고 있다. 이를 위해서는 센서데이터와 서비스 도메인 지식의 융합을 위한 센서데이터의 시맨틱화는 필수적이다. 하지만 기존의 시맨틱 변환기술은 정적인 메타데이터를 시맨틱 데이터(RDF)로 변환하는 기술이며, 이는 사물인터넷 환경의 실시간성, 대용량성의 특징을 제대로 처리할 수 없는 실정이다. 따라서 본 논문에서는 사물인터넷 환경에서 발생하는 대용량 스트리밍 센서데이터의 실시간?병렬처리를 통해 시맨틱 데이터로 변환하는 기법을 제시한다. 본 기법에서는 시맨틱 변환을 위한 변환규칙을 정의하고, 정의된 변환규칙과 온톨로지 기반 센서 모델을 통해 실시간?병렬로 센서데이터를 시맨틱 변환하여 시맨틱 레파지토리에 저장한다. 성능향상을 위해 빅데이터 실시간 분석 프레임워크인 아파치 스톰을 이용하여, 각 변환작업을 병렬로 처리한다. 이를 위한 시스템을 구현하고, 대용량 스트리밍 센서데이터인 기상청 AWS 관측데이터를 이용하여 제시된 기법에 대한 성능평가를 진행하여, 본 논문에서 제시된 기법을 입증한다.
대용량 스트리밍 센서데이터 환경에서 RDFS 규칙기반 병렬추론 기법
최근 스마트폰의 폭발적인 보급, IoT와 클라우드 컴퓨팅 기술의 고도화, 그리고 IoT 디바이스의 보편화로 대용량 스트리밍 센싱데이터가 출현하였다. 또한 이를 기반으로 데이터의 공유와 매쉬업 통해 새로운 데이터의 가치를 창출하기 위한 요구사항의 증대로 대용량 스트리밍 센싱데이터 환경에서 시맨틱 웹 기술과의 접목에 관한 연구가 활발히 진행되고 있다. 하지만 데이터의 대용량성?스트리밍성으로 인해 새로운 지식을 도출하기 위한 지식 추론분야에서 많은 이슈들에 직면하고 있다. 이러한 배경하에, 본 논문에서는 IoT 환경에서 발생하는 대용량 스트리밍 센싱데이터를 시맨틱웹 기술로 처리하여 서비스하기 위해 RDFS 규칙기반 병렬추론 기법을 제시한다. 제안된 기법에서는 기존의 규칙추론 알고리즘인 Rete 알고리즘을 하둡프레임워크 맵리듀스를 통해 병렬로 수행하고, 공용 스토리지로서 하둡 데이터베이스인 HBase를 사용하여 데이터를 공유한다. 이를 위한 시스템을 구현하고, 대용량 스트리밍 센싱데이터인 기상청 AWS 관측데이터를 이용하여 제시된 기법에 대한 성능평가를 진행하고, 이를 입증한다.