검색 : [ keyword: 그래프 ] (76)

관계기반 요약그래프에서 효율적인 최단경로 탐색기법

김현욱, 서호진, 이영구

http://doi.org/10.5626/JOK.2017.44.7.710

그래프 데이터가 대용량화됨에 따라 데이터를 저장 및 유지하기 위한 비용이 지속적으로 증가하고 있다. 이와 같은 대용량 그래프에서 최단경로를 탐색하는 것은 빈번한 디스크 I/O와 그래프의 높은 복잡도로 인해 매우 오랜 수행시간을 요구한다. 최근 그래프의 밀집도가 높은 부분그래프를 하나의 슈퍼노드로 표현하여 그래프 크기와 디스크 I/O를 줄이는 그래프 요약 연구가 수행되고 있다. 이와 같은 요약된 그래프에서 효율적으로 최단경로를 탐색하기 위해서는 요약그래프의 복원을 최소화해야 한다. 본 논문에서는 요약그래프의 복원 성능을 분석하고, 이를 이용하여 오차를 최소화하며 빠르게 최단경로를 탐색하는 근사 기법을 제안한다. 또한 최단경로 탐색과정 중 복원이 요구되는 슈퍼노드가 포함된 경로를 사전에 색인으로 구축하여 정확한 최단경로를 효율적으로 탐색하는 기법을 제안한다. 실세계 데이터를 이용한 실험을 통하여 제안하는 요약그래프에서의 최단거리 탐색기법이 원본 그래프를 고려한 기법들보다 최대 70%로 수행시간이 향상되었음을 보인다.

그래프 기반 Wi-Fi 신호 지도 구축 및 갱신 기법

유수빈, 최원익

http://doi.org/10.5626/JOK.2017.44.6.643

Wi-Fi 기반 실내 측위 기법 중 핑거프린팅 측위는 높은 정밀도로 가장 보편적인 기술 중 하나이다. 그러나 초기 신호 지도 구축과 이 후 갱신 과정은 수동으로 이루어져 많은 노동력과 시간 비용을 발생시키는 단점이 있다. 본 논문에서는 그래프를 기반으로 각 정점에서 초기 신호 지도를 구축 하는 것을 제안한다. 그리고 사용자로부터 획득한 신호 세기 데이터를 각 간선에 참조 위치를 생성하여 자동으로 매핑하여 신호 지도를 갱신하는 방법을 제안한다. 제안하는 방식은 초기 신호 지도를 그래프의 정점에서만 신호를 수집하여 구축하고 갱신은 자동으로 수행하므로 기존 핑거프린팅 무선 측위 기법의 단점인 노동력과 시간 비용을 크게 감소시킬 수 있다. 실험 결과, 실제 위치에서의 데이터와의 비교를 통해 신호 지도 갱신 기법을 검증할 수 있었고 자동으로 신호 지도를 갱신하는 작업으로 약 3.2m, 3.5m의 정밀도를 갖는 신호 지도를 구축할 수 있었다.

단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법

송광호, 김유성

http://doi.org/

키워드 추출은 주어진 문서로부터 문서의 주제나 내용에 관련된 단어들을 추출해내는 방법으로 대량의 문서를 다루는 텍스트마이닝 연구들이 전처리에서 공통적으로 거치는 대표 자질 추출에서 중요하게 활용될 수 있다. 본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출하기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이를 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다. 그리고 제안한 방법의 정확성과 주제적 포괄성 검증을 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

맵리듀스 기반 상향식 최대 밀도 부분그래프 탐색 알고리즘

이웅희, 김영훈

http://doi.org/

최대 밀도 부분 그래프는 소셜 네트워크에서 사용자들이 속한 특정 커뮤니티나 사용자들의 공통 관심사를 나타내기에, 최대 밀도 부분 그래프를 찾는 연구가 다수 있었다. 그러나 기존의 연구들은 단일한 최고 밀도 부분 그래프를 찾는다는 문제점이 있었다. 이 연구에서는 주어진 노드에서 시작하여, 인접하는 노드 중에 연결수(degree)가 가장 높은 노드를 추가하는 방식을 사용한 최고 밀도 부분 그래프를 찾는 상향식 휴리스틱 알고리즘을 제안한다. 이에 따라, 병렬 처리에 용이하게 하였고, 이를 맵리듀스 프레임워크 상에서 병렬 알고리즘으로 구현하였다. 다양한 그래프 데이터로 실험결과 이전 연구와 비교하여 조기에 최고 밀도 부분 그래프를 찾아냄을 보였다. 또한 다양한 다수의 노드가 주어졌을 때에도 효과적으로 동작함을 보였다.

대용량 그래프 압축과 마이닝을 위한 그래프 정점 재배치 분산 알고리즘

박남용, 박치완, 강유

http://doi.org/

수십억 개 간선들로 구성된 대용량 그래프를 어떻게 효과적으로 압축할 수 있을까? 정점 재배치를 통해 인접 행렬의 0이 아닌 값들을 집중시키면 그래프를 효율적으로 압축할 수 있을 뿐 아니라 페이지랭크 등 여러 그래프 마이닝 알고리즘의 수행 속도를 개선할 수 있다. 최신 정점 재배치 기법인 SlashBurn 은 실세계 네트워크의 멱법칙 특성을 활용하는 실세계 그래프에 효과적인 방법이다. 하지만 단일 머신 기반으로 설계되어 대용량 그래프에 대해 처리 속도가 현저히 느려지거나 적용이 불가능한 한계가 있다. 본 논문에서는 이러한 한계를 극복하기 위한 분산 SlashBurn을 제안한다. 분산 SlashBurn은 대규모의 정점재배치 프로세스를 분산 처리하여 대용량 그래프를 기존 방법보다 훨씬 빠르고 확장성 있게 처리한다. 대용량 실세계 그래프들에 대한 실험 결과, 분산 SlashBurn은 단일 머신 SlashBurn보다 45배 이상 빠르게 동작하였고, 16배 이상 큰 그래프를 처리할 수 있었다.

Min-Hash를 이용한 효율적인 대용량 그래프 클러스터링 기법

이석주, 민준기

http://doi.org/

그래프 클러스터링은 서로 유사한 특성을 갖는 정점들을 동일한 클러스터로 묶는 기법으로 그래프 데이터를 분석하고 그 특성을 파악하는데 폭넓게 사용된다. 최근 소셜 네트워크 서비스와 월드 와이드 웹, 텔레폰 네트워크 등의 다양한 응용분야에서 크기가 큰 대용량 그래프 데이터가 생성되고 있다. 이에 따라서 대용량 그래프 데이터를 효율적으로 처리하는 클러스터링 기법의 중요성이 증가하고 있다. 본 논문에서는 대용량 그래프 데이터의 클러스터들을 효율적으로 생성하는 클러스터링 알고리즘을 제안한다. 우리의 제안 기법은 그래프 내의 클러스터들 간의 유사도를 Min-Hash를 이용하여 효과적으로 추정하고 계산된 유사도에 따라서 클러스터들을 생성한다. 실세계 데이터를 이용한 실험에서 우리는 본 논문에서 제안하는 기법과 기존 그래프 클러스터링 기법들과 비교하여 제안기법의 효율성을 보였다.

컴퓨터 게임의 NPC를 위한 적응적 경로 이동의 구현

김은솔, 김혜연, 유견아

http://doi.org/

컴퓨터 게임에서 NPC(NonPlayer Character)의 획일적인 경로 이동은 게임 플레이어의 흥미를 떨어뜨리는 요인이 된다. 웨이포인트 그래프를 이용한 길찾기의 경우, NPC가 지정된 위치만을 이용하여 이동하게 되므로 이 문제점은 더욱 두드러져 보인다. 본 논문에서는 이 문제의 해결을 위해 플레이어의 이동을 관찰하여 NPC가 적응적으로 경로를 계획할 수 있도록 하는 방법을 제안한다. 제안하는 방법은 우선, 플레이어 이동의 포인트 지정을 관찰하여 웨이포인트를 동적으로 수정하고, 수정된 웨이포인트들을 NPC의 경로 탐색에 이용하는 것이다. 또한 플레이어의 지형 선호도를 학습하여 NPC별로 특성에 맞는 경로를 계획하기 위한 알고리즘을 제안한다. 유니티 4.0으로 제작된 RPG(Role Playing Game) 게임으로 구현된 알고리즘을 시뮬레이션하여 NPC 이동이 다양해지고 플레이어의 이동과 유사한 방향으로 개선됨을 확인한다.

준지도 학습에서 꼭지점 중요도를 고려한 레이블 추론

오병화, 양지훈, 이현진

http://doi.org/

준지도 학습은 기계 학습의 한 분야로서, 레이블된 데이터와 레이블되지 않은 데이터 모두를 사용하여 모델을 학습함으로써 지도 학습에 비해 예측 정확도를 높일 수 있다. 최근 각광받고 있는 그래프 기반 준지도 학습은 입력 데이터를 그래프의 형태로 변환하는 그래프 구축 단계와 이를 사용하여 레이블되지 않은 데이터의 레이블을 예측하는 레이블 추론 단계로 나뉜다. 이 추론은 준지도 학습에서의 평활도 가정을 기본으로 한다. 본 연구에서는 추가로 각 꼭지점 중요도를 결합함으로써 개선된 레이블 추론알고리즘을 제안한다. 이와 함께 알고리즘의 수렴성을 증명하고, 또한 실험을 통해 알고리즘의 우수성을 검증하였다.

인메모리 기반 병렬 컴퓨팅 그래프 구조를 이용한 대용량 RDFS 추론

전명중, 소치승, 바트셀렘, 김강필, 김진, 홍진영, 박영택

http://doi.org/

근래에 들어 풍부한 지식베이스를 구축하기 위한 대용량 RDFS 추론에 대한 관심이 높아지면서 기존의 단일 머신으로는 대용량 데이터의 추론 성능을 향상시키기에 한계가 있다. 그래서 분산 환경에서 의 RDFS 추론 엔진 개발이 활발히 연구되고 있다. 하지만 기존의 분산 환경 엔진은 실시간 처리가 불가능 하며 구현이 어렵고 반복 작업에 취약하다. 본 논문에서는 이러한 문제를 극복하기 위해 병렬 그래프 구조 를 사용한 인-메모리 분산 추론 엔진 구축 방법을 제안한다. 트리플 형태의 온톨로지는 기본적으로 그래프 구조를 가지고 있으므로 그래프 구조 기반의 추론 엔진을 설계하는 것이 직관적이다. 또한 그래프 구조를 활용하는 오퍼레이터를 활용하여 RDFS 추론 규칙을 구현함으로써 기존의 데이터 관점과 달리 그래프 구조의 관점에서 설계할 수 있다. 본 논문에서 제안한 추론 엔진을 평가하기 위해 LUBM1000(1억 3천 3백만 트리플, 17.9GB), LUBM3000(4억 1천 3백만 트리플, 54.3GB)에 대해 추론 속도를 실험을 하였으며 실 험결과, 비-인메모리 분산 추론 엔진보다 약 10배 정도 빠른 추론 성능을 보였다.

함수 수준 특징정보 기반의 오픈소스 소프트웨어 모듈 탐지

김동진, 조성제

http://doi.org/

OSS(Open-Source Software)의 사용 증가와 함께 라이선스 위반, 취약한 소스코드 재사용 등에 의한 분쟁 및 피해가 빈번해지고 있다. 이에, 실행파일(바이너리) 수준에서 프로그램에 OSS 모듈이 포함되었는지 여부를 확인하는 기술이 필요해졌다. 본 논문에서는 바이너리에서 함수 수준의 특징정보를 사용하여 OSS 모듈을 탐지하는 기법을 제안한다. 기존 소프트웨어 특징정보(버스마크) 기반 도용 탐지 기법들은 프로그램 전체 간 유사성을 비교하기 때문에 프로그램의 일부로 포함된 OSS 모듈들을 탐지하는데 부적합하다. 본 논문에서는, 함수 수준의 실행명령어, 제어 흐름 그래프(Control Flow Graph)와 개선된 함수 수준 구조적 특징정보를 추출하고 유사성을 비교하여 OSS 모듈의 임의 사용 여부를 탐지한다. 제안기법의 효율성과 각 특징정보들의 OSS 탐지 성능을 평가하기 위해, 특징정보량, OSS 모듈 탐지 시간 및 정확도, 컴파일러 최적화에 대한 강인성을 실험하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr