검색 : [ keyword: knowledge bases ] (1)

Efficient Approach for Encoding and Compression of RDF Knowledge Bases

Tangina Sultana, Young-Koo Lee

http://doi.org/10.5626/JOK.2022.49.3.241

엔티티 중심 검색 및 자연어 기반 질의의 엄청난 성장으로 인해 활용 가능한 지식 베이스(Knowledge Bases, KBs)의 크기가 기하급수적으로 증가하였다. 따라서 대용량의 데이터를 효율적으로 검색하는 SPARQL 쿼리 검색 엔진이 필요하다. RDF 엔진은 주로 지식 베이스를 관리하기 위해 순서, 좌표, 구문 및 해시 기반 인코딩을 사용한다. 그러나 대부분의 기존 방법에서는 더 좋은 압축률을 보이지 못하고, 적재 시간이 느리며, 질의 성능이 효율적이지 않다. 따라서 본 논문에서는 더 높은 압축률을 달성하고 압축 및 인코딩된 데이터에 대한 SPARQL 쿼리의 성능을 향상시키기 위해 빈발하고 의미적으로 관련된 용어를 감지하는 접근 방식을 제안한다. 이 기법은 통계 정보와 의미론적 접근을 결합한 접근 방식으로 사전 인코딩 알고리즘을 기반으로 한다. 의미론을 기반으로 자주 사용되지 않는 용어를 식별하는 스키마를 도입했다. 그리고 시스템은 의미론적으로 관련된 데이터를 온톨로지 클래스로 조합하여 필요한 메모리 적재를 통해 로딩 시간을 더욱 줄여준다. 우리는 제안된 기법을 기존의 접근 방식과 실험을 통해 비교를 진행하고, 실험 결과 우리가 제안한 접근 방식이 기존 시스템보다 지식 베이스를 훨씬 더 효과적으로 압축하고 인코딩함을 확인한다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr