45권 8호,
8월 2018
디지털 라이브러리
클라우드 컴퓨팅 환경에서 인증테이블을 이용한 ARP 스푸핑 방어기법
http://doi.org/10.5626/JOK.2018.45.8.755
최근 많은 전 세계 기업들은 비용절감, 성능개선, 업무프로세스의 혁신을 목적으로 클라우드 서비스를 도입하고 있지만 클라우드 내 가상머신을 대상으로 하는 외부 스푸핑 또는 Poison 공격으로 인해 발생 될 수 있는 클라우드 시스템의 성능 저하는 클라우드 컴퓨팅 시스템 확산에 많은 걸림돌이 되고 있다. 이런 보안사고를 예방하기위해 많은 연구가 진행되었지만 실현가능성이 낮은 새로운 프로토콜의 제안, 대규모 네트워크에 적용하기 어려운 확장성의 한계를 가지고 있다. 이에 본 논문에서는 최근 많은 클라우드 서비스 개발 회사가 차용하고 있는 오픈소스 클라우드 플랫폼인 OpenStack을 이용하여 클라우드 환경을 구축하고 OpenStack의 인증서비스를 제공하는 Keystone을 이용한 인증 테이블을 통하여 스푸핑 혹은 Poison이라 불리는 네트워크 공격에 대한 방어기법을 제안하고자 한다.
Effective Parallel LiDAR Triangulated Irregular Network Construction Method Using Convex Boundary Triangle
Permata Nur Rizki, Sangyoon Oh
http://doi.org/10.5626/JOK.2018.45.8.761
TIN(Triangulated Irregular Network) 모델은 연속 삼각형들로 정보를 표현하는 모델로서, 측정된 점 데이터로부터 지표면을 표현하는데 보편적으로 사용되는 그리드 모델 대비 해상도와 유연성 측면에서 강점을 가지고 있어서 최근 다양한 디지털 지도를 생성하는데 사용되고 있다. 그러나, TIN 모델을 생성하기 위해서는 많은 양의 반복 계산이 필요하며, 따라서 LiDAR 데이터와 같이 대용량 센싱 정보로부터 TIN을 생성하는 데에는 일반적인 순차방식 대비 보다 효과적인 처리 방안이 필요하다. 본 연구에서는 Convex Boundary Triangle을 사용하여 병렬 처리를 위한 효과적인 data decomposition을 수행하고, MapReduce 병렬 처리 방식을 사용해서 TIN을 생성하는 방안을 소개한다. 본 제안방식은 convex boundary 정보에 따른 데이터분할, Delaunay 특성 만족 검증, 그리고 merge 단계로 이루어져 있으며, 제안 방식의 성능 검증을 위해서 Apache Spark 플랫폼 기반으로 알고리즘을 구현하였다. 처리 성능과 확장성 관련 실험을 통해 본 제안 방식이 기존 방식 대비 merging 처리 시간을 평균 16.2% 줄였음을 확인하였다.
난독화된 악성코드 판별을 위한 2차원 배열 기반의 기술 연구
http://doi.org/10.5626/JOK.2018.45.8.769
일평균 20만개 이상의 악성코드가 출현하고 있으며, 대부분의 침해사고는 악성코드를 이용하여 발생한다. 그런데, 공격자의 악성코드 제작기술이 점차 지능화되고 있으며 역 공학 분석을 방지하기 위해 패킹이나 암호화를 하여 악성코드를 제작한다. 정적 분석의 경우 분석 파일이 난독화가 되면 분석을 하는데 한계가 있으며, 이에 대응할 수 있는 방안이 필요하다. 본 논문에서는 난독화 시에도 악성코드를 판별할 수 있는 방안으로 문자열, 심볼, 엔트로피 기반 접근 방법을 제시하였다. 특히, 고정된 feature-set 뿐 아니라, 고정되지 않은 Feature-set 처리를 위해 2차원 배열을 적용하였으며, 15,000개의 악성/정상 샘플을 DNN(Deep Neural Network)를 통해 검증을 진행하였다. 본 연구는 향후 여러 악성코드 탐지기법과 연계되어 동작 시 보완적인 형태로 동작할 것으로 예상하며, 난독화된 악성코드 변종 분석에서 활용 가능할 것으로 기대한다.
Z-함수를 이용한 순위패턴매칭과 순위다중패턴매칭 병렬계산
http://doi.org/10.5626/JOK.2018.45.8.778
순위패턴매칭문제는 길이가 각각 n, m 인 텍스트 T와 패턴 P가 주어졌을 때, P와 순위동형인 T의 모든 부분문자열의 위치를 찾는 문제이다. 순위다중패턴매칭문제는 길이가 n인 텍스트 T와 패턴 집합 W={P₁, P₂,…, Pb}가 주어졌을 때 W의 패턴들과 순위동형인 T의 모든 부분문자열의 위치를 찾는 문제이다. 본 논문에서는 Z-함수를 기반으로, 순위패턴매칭문제를 O(n+hm)개의 스레드를 사용하여 O(m) 시간에 해결하는 병렬알고리즘과 순위다중패턴매칭문제를 O(b(n+M))개의 스레드를 사용하여 O(n+M) 시간에 해결하는 병렬알고리즘을 제시한다. 이때, h는 블록의 개수이며, M은 W에서 가장 긴 패턴의 길이를 나타낸다. 실험 결과, 순위패턴매칭문제에 대한 병렬알고리즘은 순차알고리즘보다 m=10, n=1,000,000일 때 약 71.2배 빠르게 수행되었다. 또한 순위다중패턴매칭문제에 대한 병렬알고리즘은 b=1,000, m=10, n=1,000일 때 순차알고리즘보다 약 12.2배 빠르게 수행되었다.
Backbone Network for Object Detection with Multiple Dilated Convolutions and Feature Summation
Vani Natalia Kuntjono, Seunghyun Ko, Yang Fang, Geunsik Jo
http://doi.org/10.5626/JOK.2018.45.8.786
컨볼루션 뉴럴 네트워크의 발전으로 인해 객체 탐지, 이미지 세분화 및 객체 분류 분야에서도 100개 이상의 컨볼루션 레이어를 사용하는 Deep CNN을 사용하는 추세로 이어지고 있다. 그러나 Deep CNN을 사용하기 위해 많은 그래픽 메모리가 필요하며 제한된 자원이나 실시간 객체 탐지를 원하는 사람들에게는 이런 Deep CNN이 적합하지 않다. 본 논문에서는 배수 팽창된 컨볼루션과 특징합계 기반의 객체 탐지를 위한 새로운 백본 네트워크를 제안한다. 특징합계는 그래디언트를 쉽게 전달하고 컨볼빙으로 인해 발생하는 공간 정보의 손실을 최소화한다. 그리고 팽창된 컨볼루션을 사용함으로써 변수를 추가하지 않고도 개별 뉴런의 수용 영역을 넓힐 수 있다. 또한, Deep하지 않은 뉴럴 네트워크를 백본으로 사용함으로써 제한된 자원으로 이미지넷 데이터 세트에서 사전 교육을 하지 않더라도 제안하는 네트워크를 사용할 수 있다. Pascal VOC 및 MS COCO 데이터를 사용한 실험 결과 제안된 네트워크는 각각 71%와 38.2%의 정확도를 보였다.
Bidirectional LSTM-CRF 기반의 음절 단위 한국어 품사 태깅 및 띄어쓰기 통합 모델 연구
http://doi.org/10.5626/JOK.2018.45.8.792
일반적으로 한국어 품사 태깅은 단어 단위로 띄어쓰기가 완료된 문장을 입력으로 받는다. 만일 띄어쓰기가 제대로 되지 않은 문장을 처리하기 위해서는 오류를 수정하기 위한 자동 띄어쓰기 처리가 선행되어야 한다. 그러나 자동 띄어쓰기 처리와 품사 태깅을 순차적으로 수행하면 각 단계에서 발생하는 오류로 인해 심각한 성능 저하 현상이 발생할 수 있다. 본 연구에서는 자동 띄어쓰기와 품사 태깅을 동시에 수행할 수 있는 통합 모델을 구축하여 이러한 문제를 해결하고자 한다. 세부적으로 Bidirectional LSTM-CRF 모델을 바탕으로 음절 기반의 띄어쓰기 및 품사 태깅을 상보적으로 동시에 수행할 수 있는 통합 모델을 제안한다. 한국어 문어 품사 부착 말뭉치를 이용한 실험 결과, 띄어쓰기가 완전한 문장에 대해서는 98.77%의 품사 태깅 성능을 보였으며, 띄어쓰기가 전혀 되어 있지 않은 문장 집합에 대해서는 97.92%의 형태소 단위 F1-measure 성능을 나타내었다.
산점도 진단분석과 분할 변수 선택 기법을 활용한 점진적인 시각적 분석
http://doi.org/10.5626/JOK.2018.45.8.801
본 논문에서는 산점도 진단분석의 일종인 분할 변수 선택 기법에 점진적 시각화를 접목한 시각적 분석 시스템을 제시한다. 기존 분할 변수 선택 기법의 한계인 확장성 및 성능의 문제를 극복하기 위해 인터페이스 요소들은 모두 분석 진행 상황을 실시간으로 갱신하도록 설계하였다. 인터페이스의 구성은 크게 두 부분으로 분석의 대상이 되는 산점도들을 하나의 점으로 표현한 개요 시각화(overview)와 흥미로운 산점도들을 더욱 자세히 살펴볼 수 있는 세부 시각화(detailed view)로 나누어 설계하였다. 이러한 설계의 목적과 이유를 소개하는 한편, 사용자가 어떻게 효과적으로 이 시스템을 사용할 수 있는지에 대한 데이터 분석 시나리오를 제시한다.
한국어 수업 대화의 화행 분석과 화행 자동분류를 위한 언어학적 기반연구
http://doi.org/10.5626/JOK.2018.45.8.807
화행이란 의사소통 과정에서 발화자가 가지는 발화 의도를 말한다. 성공적인 의사소통을 위해서는 발화자의 화행을 정확하게 파악하는 것이 매우 중요하다. 본 논문에서는 한국어 대화체 문장의 화행자동분류를 위해, 화행을 결정짓는 요인이 무엇인지 언어학적으로 분석하고자 하였다. 한국어 수업 대화를 분석하여 화행 분류 체계를 자체 정립하였고, 언어학적 근거를 바탕으로 13개의 화행 분류 자질을 제안하였다. 또한, 제안하는 화행 분류 자질을 검증하고자 웨카(Weka)를 이용하여 정확률 실험을 진행하였다. 본 연구에서 제안한 다양한 언어학적 자질을 이용하여 발화의 화행을 자동분류한 경우 70.03%의 정확률을 보였다. 이는 유니그램과 바이그램만으로 화행을 자동분류한 베이스라인에 비해 약 30%p의 정확률이 향상된 결과이다.
CNN 기반 관계 추출 모델의 성능 향상을 위한 다중-어의 단어 임베딩 적용
http://doi.org/10.5626/JOK.2018.45.8.816
관계 추출이란 문장 내 두 개체간의 관계를 분류하는 것으로, 많은 연구들이 관계추출 모델을 설계함에 있어 원격 지도학습 방식을 이용하고 있다. 그리고 최근 딥러닝의 발전으로 다양한 연구에서 관계 추출 모델 설계 시 CNN 또는 RNN 등의 딥러닝 모델을 적용하는 것이 주요 흐름으로 발전하고 있다. 그러나 기존 연구들에서는 모델 학습의 입력으로 사용되는 단어 임베딩의 동형이의어 문제를 해결하지 않았다는 단점이 있다. 따라서 서로 다른 의미를 가진 동형이의어가 하나의 임베딩 값으로 모델 학습이 진행되고, 그에 따라 단어의 의미를 정확히 파악하지 못한 채 관계 추출 모델을 학습한다고 볼 수 있다. 본 연구에서는 다중-어의 단어 임베딩을 적용한 관계 추출 모델을 제안한다. 다중-어의 단어 임베딩 학습을 위해 CoreNet Concept 기반의 어의 중의성 해소 모듈을 활용하였고, 관계추출 모델은 문장 내 주요 키워드를 스스로 학습하는 CNN 모델과 PCNN 모델 2가지를 활용하였다.
배깅 기반의 부트스트래핑을 이용한 개체명 인식 학습 기법
http://doi.org/10.5626/JOK.2018.45.8.825
기존 개체명 인식 연구는 지도학습에 기반한 개체명인식이 주를 이루고 있다. 지도학습에 기반한 개체명인식이 좋은 성능을 보이고 있지만, 대량의 정답 말뭉치를 구축하기 위해 많은 시간과 비용을 필요로 한다는 문제점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해, 대량의 말뭉치에 수동으로 정답을 부여하기 위한 노력 없이, 개체명 인식 모델이 자동 생성한 정답을 학습에 사용하는 개체명 인식 모델 학습 기법을 제안한다. 제안 방법은 소량의 개체명 정답 말뭉치만으로 대량의 개체명 정답을 자동 생성하여 학습에 사용하므로, 대량의 정답 말뭉치를 생성하기 위해 필요한 시간과 비용을 크게 절감시킨다. 추가적으로 배깅 기법을 사용하여 자동 생성한 정답들 중 오류를 제거한다. 부트스트래핑 기법과 배깅 기법을 추가하였을때, F1 점수 최고 70.67%를 기록하였다. 비교를 위한 기본 CRF 개체명 인식 모델의 F1 점수는 65.59%를 기록하였다.
합성곱 신경망과 영상 개선 신경망을 이용한 저해상도 영상 객체 인식
http://doi.org/10.5626/JOK.2018.45.8.831
최근 합성곱 신경망을 비롯한 심층 학습 기술의 발전으로 영상에서의 객체 인식의 성능이 월등히 향상되었다. 하지만 객체 인식은 영상에 포함된 다양한 변형과 인식 대상이 되는 객체의 다양성 등으로 여전히 정복하기 어려운 문제들이 남아있다. 특히 저해상도 영상에서의 객체 인식에 관한 연구는 아직 초기 단계로 만족할 만한 성능을 보이지 못하고 있다. 본 논문에서는 저해상도 영상에서의 객체 인식 성능을 향상시키기 위한 영상 개선 신경망을 제안하고 이로부터 획득한 영상을 합성곱 신경망 기반의 객체인식 모델의 학습 및 인식에 추가적으로 활용함으로써 해상도 변화에 강건한 객체 인식 방법을 제안한다. 제안하는 방법의 효율성을 확인하기 위해 CIFAR-10 데이터베이스와 CIFAR-100 데이터베이스를 사용하여 저해상도 환경에서의 객체 인식 성능을 측정하였고, 제안하는 방법이 저해상도 객체 인식 성능을 향상시킴과 동시에 고해상도 객체 인식 성능도 안정적으로 유지하는 것을 확인하였다.
분산 처리 환경에서 동적 분할 그리드 색인 기반 근사 k-최근접 질의 처리
http://doi.org/10.5626/JOK.2018.45.8.838
최근 스마트 기기의 대중화로 다양한 위치 기반 서비스가 제공되고 있다. 소셜 네트워크 서비스와 결합한 위치 기반 소셜 네트워크 서비스들은 대규모의 사용자가 존재한다. 이러한 서비스들은 사용자를 중심으로 가장 가까운 위치를 제공하는 k-최근접 질의 처리의 요구가 증가하고 있다. 본 논문에서는 실시간 응답 요구를 위해 동적 분할 기반의 그리드 색인을 구축하여 근사 k-최근접 질의 처리를 수행하는 기법을 제안한다. 제안하는 근사 k-최근접 질의 처리 기법은 사용자의 이동 방향을 고려하여 이동 방향에 위치하는 셀을 우선하여 탐색한다. 또한, 근사 k-최근접 질의의 정확성 개선을 위해 그리드 동적 분할 방법과 그리드 색인에서 셀 탐색을 최적화한다. 제안하는 기법은 스트림 환경에서 효율적인 분산 처리를 수행하기 위해 스톰에서 구현된다. 우수성을 입증하기 위해 다양한 성능 평가를 수행한다.
블록체인의 이중지불 탐지 알고리즘
http://doi.org/10.5626/JOK.2018.45.8.848
블록체인은 전자화폐시스템으로 널리 사용되고 있는 비트코인의 기반이 되는 기술이다. 비트코인에서 하나의 전자화폐로 두 번 이상의 거래를 하는 것을 이중지불(double-spending)이라고 하며 불법거래에 해당한다. 현재 블록체인은 블록들이 연결된 체인에서 분기가 생기는 경우, 더 많은 블록들이 연결된 체인을 유효한 거래로 인정하는 방식을 취하는데, 불법거래를 포함한 블록들의 체인이 정상거래 블록들의 체인보다 더 길어질 수 있는 가능성이 존재하므로 체인의 길이만으로는 불법거래를 완벽하게 방지할 수는 없다. 본 논문에서는 이중지불을 탐지하는 방법과 탐지 후 다른 노드에게 알리는 방법을 제안한다. 비트코인 오픈소스를 사용하여 제안 방법을 구현하고 검증하였다.
UHD 스트리밍 서비스의 QoE 향상을 위한 VBR 콘텐츠 특성 기반의 품질 적응 기법
http://doi.org/10.5626/JOK.2018.45.8.856
네트워크의 발전과 스마트 기기의 보급으로 UHD(Ultra High Definition) 비디오의 수요가 증가하면서 HTTP 적응적 스트리밍(HTTP Adaptive Streaming)이 주목받고 있다. 기존 품질 적응 기법은 VBR(Variable Bit Rate) 콘텐츠 특성을 고려하지 않은 대역폭 측정과 측정된 대역폭이나 버퍼 점유량만을 이용한 품질 선택으로 인해 QoE(Quality of Experience)가 저하되는 문제가 있다. 본 논문에서는 UHD 스트리밍 서비스의 QoE 향상을 위한 VBR 콘텐츠 특성 기반의 품질 적응 기법을 제안한다. 제안하는 기법은 VBR 콘텐츠 특성을 고려해 대역폭을 측정한다. 요청할 품질은 버퍼 점유량의 변화를 반영한 품질 적응 구간을 기반으로 선택함으로써 평균 품질을 높이고 불필요한 품질 변경을 최소화한다. 실험 결과 제안하는 기법이 기존 기법들보다 높은 평균 품질과 적은 품질 변경으로 QoE를 향상시키는 것을 확인하였다.
Gender Recognition from Facial Sketch Images using Local Adaptive Structural Pattern
Md Tauhid Bin Iqbal, Oksam Chae
http://doi.org/10.5626/JOK.2018.45.8.866
논문에서는 얼굴 스케치 이미지에서 성별을 인식하기 위해 LASP(Local Adaptive Structural Pattern)라는 새로운 에지 기반 지역 영상 묘사자를 제안한다. LASP는 Kirsch 나침반 마스크를 적용하여 8 방향 화소에 대한 에지 반응을 생성하고, 지역 텍스처 구조를 나타내는 상위 두 방향을 선택한다. 또한, LASP는 평평한 화소에서의 낮은 응답을 필터링하기 위해 큰 응답의 방향 성분에 적응적으로 선택된 임계값을 적용한다. 상위 두 개의 Kirsch 방향은 지역 텍스처 구조를 적절히 표현한다. Kirsch 응답의 상위 임계 값은 평면 영역에서 생성된 낮은 응답을 갖는 코드를 차별화하여 얼굴 스케치의 강인한 묘사를 생성하게 한다. 우리는 기존 얼굴 스케치 데이터셋을 이용해 성별 인식을 위한 LASP의 성능을 평가하였으며, 기존 지역 묘사자들보다 우수한 정확도를 보였다.