46권 3호,
3월 2019
디지털 라이브러리
ARM 기반 IoT 장치에서 효율적인 딥 러닝 수행을 위한 BLAS 및 신경망 라이브러리의 성능 및 에너지 비교
http://doi.org/10.5626/JOK.2019.46.3.219
기존에 IoT 장치에서 딥 러닝을 수행하기 위해 주로 클라우드 컴퓨팅을 사용했다. 그러나 클라우드 컴퓨팅을 사용할 경우 연결을 보장할 수 없고, 통신을 위한 에너지 소모, 그리고 보안에 대한 취약성이 문제가 된다. 이와 같은 문제점을 해결하기 위해 최근 IoT 장치 내에서 딥 러닝을 수행하기 위한 시도가 진행되고 있다. 이 시도들은 주로 IoT 장치를 위한 연산량이 적은 딥 러닝 모델 또는 압축 기법 등을 제안하지만, 실제 IoT 장치에서 수행될 때의 영향에 대한 분석이 부족했다. IoT 장치마다 연산 장치의 구성과 지원되는 라이브러리가 다르기 때문에, 최적의 딥 러닝 수행을 위해 각 IoT 장치에서 다양한 수행환경에 대한 분석이 필요하다. 본 논문에서는 다양한 하드웨어 구성을 가진 IoT 장치에서 수행 환경에 따른 성능 및 에너지를 측정하고 분석한다. 또한, 적절한 라이브러리를 사용하는 것만으로도 속도와 에너지 효율이 최대 9.43배, 26.78배까지 상승하는 것을 보여준다.
효율적인 동역학 모델 개발을 위한 모델에이전트 설계
http://doi.org/10.5626/JOK.2019.46.3.228
국방 모델링 및 시뮬레이션(Defense Modeling & Simulation, 이하 DM&S) 기반의 무기체계 시뮬레이터를 개발하는 과정에서, 다양한 동역학 모델이 필요하다. 또한 DM&S의 목적에 따라 요구되는 동역학 모델의 정밀도(Accuracy)가 다르기 때문에, 이를 만족시키기 위해 동역학 모델을 수정해야 한다. 본 논문에서는 모델에이전트 - 효율적으로 동역학 모델을 개발 및 관리할 수 있는 소프트웨어 - 의 설계구조를 제안한다. 모델에이전트는 객체지향 언어를 사용하여 캡슐화(Encapsulation)하여 재사용성(Reusability)을 향상시킬 뿐 아니라, 디자인 패턴을 적용하여 다양한 요구사항에 대처가 용이하도록 확장성(Scalability) 있게 설계되었다. 또한 모델에이전트는 공통 인터페이스를 제공하여 동역학 모델 개발 시 이식성이 용이하도록 설계되었다.
포지션 인코딩 기반 S³-Net를 이용한 한국어 기계 독해
http://doi.org/10.5626/JOK.2019.46.3.234
S³-Net은 Simple Recurrent Unit (SRU)과 자기 자신의 RNN sequence에 대하여 어텐션 가중치(attention weight)를 계산하는 Self-Matching Networks를 기반으로 기계 독해 질의 응답을 해결하는 딥 러닝 모델이다. 기계 독해 질의 응답에서 질문에 대한 답은 문맥 내에서 발생하는데, 하나의 문맥은 여러 문장으로 이뤄지기 때문에 입력 시퀀스의 길이가 길어져 성능이 저하되는 문제가 있다. 본 논문에서는 이와 같이 문맥이 길어져 성능이 저하되는 문제를 해결하기 위하여 문장 단위의 인코딩을 추가한 계층모델과, 단어 순서 정보를 확인하는 포지션 인코딩을 적용한 S³-Net을 제안한다. 실험 결과, 본 논문에서 제안한 S³-Net 모델이 한국어 기계 독해 데이터 셋에서 기존의 S²-Net보다 우수한(single test) EM 69.43%, F1 81.53%, (ensemble test) EM 71.28%, F1 82.67%의 성능을 보였다.
Self-Attention을 활용한 Siamese CNN-Bidirectional LSTM 기반 문장 유사도 예측
http://doi.org/10.5626/JOK.2019.46.3.241
본 논문에서는 입력된 두 문장의 유사도를 측정하는 딥러닝 모델을 제안한다. 기존의 문장의 유사도 측정 모델에는 단어 혹은 형태소 단위로 문장을 분해하여 임베딩 하는 방식을 활용한다. 하지만 이는 사전의 크기를 증가시켜 모델의 복잡도를 높이는 문제점이 있다. 본 논문에서는 문장을 음소 단위로 분해하여 모델 복잡도를 줄이고 해당 음소를 묶어주는 다양한 필터 사이즈의 1D Convolution Neural Network와 Long Short Term Memory(LSTM)을 결합한 Siamese CNN-Bidirectional LSTM 모델을 제안한다. 본 모델을 평가하기 위해 네이버 지식인 데이터를 활용하여 기존의 문서 유사 측정에서 좋은 성능을 보이는 모델 Manhattan LSTM(MaLSTM)과 비교하였다.
소량의 대화 말뭉치에서 학습 가능한 효과적인 생성 기반 챗봇 모델
http://doi.org/10.5626/JOK.2019.46.3.246
잘 알려진 검색 기반 챗봇 모델과 다르게 생성 기반 챗봇 모델은 사전에 정의된 응답에 의존하지 않고 학습된 신경망 모델을 사용하여 새로운 응답을 생성한다. 하지만 생성 기반 챗봇 모델은 발화-응답 쌍의 형태를 가진 대용량의 대화 말뭉치가 필요하다. 학습 말뭉치가 충분하지 않은 경우 구문론적 오류가 발생한다. 본 논문은 이 문제를 해결하기 위해 인코딩-디코딩 단위를 형태소와 음절이 복합적으로 사용된 시퀀스-투-시퀀스 신경망 기반의 챗봇을 제안한다. 또한 대용량의 비 대화 말뭉치를 이용하여 사전 학습하고 소량의 대화 말뭉치를 이용하여 재학습하는 2단계 학습 방법을 제안한다. 소량의 대화 말뭉치(47,089개의 발화-응답 쌍 학습 데이터와 3,000개의 발화-응답 쌍 평가 데이터)를 사용한 실험에서 제안한 인코딩-디코딩 단위는 미등록어 문제를 감소시키는데 도움을 주었고, 2단계 학습 방법은 BLEU와 ROUGE와 같은 성능 향상에 도움을 주었다.
C++ 기반 범용 오픈소스 딥러닝 프레임워크 WICWIU
박천명, 김지웅, 기윤호, 김지현, 윤성결, 최은서, 김인중
http://doi.org/10.5626/JOK.2019.46.3.253
국내 대학으로는 최초로 공개한 오픈소스 딥러닝 프레임워크 WICWIU를 소개한다. WICWIU는 다양한 연산자와 모듈, 그리고 일반적인 계산 그래프들을 표현할 수 있는 신경망 구조를 제공하여 Inception, ResNet, DenseNet 등 널리 사용되는 최신 딥러닝 모델들을 구성하기에 충분한 기능을 제공한다. 또한, GPU 기반 대규모 병렬 컴퓨팅을 지원해 빠른 학습이 가능하다. 모든 API가 C++로 제공되어 C++ 개발자들이 쉽게 적응할 수 있으며, C++환경에 기반하기 때문에 파이썬 기반의 프레임워크에 비해 메모리 및 성능 최적화에도 유리하다. 따라서, 프레임워크 자체를 자원이 제한된 환경에 맞도록 수정하기에도 용이하다. 일관성 높은 코드와 API로 구성되어 가독성과 확장성이 우수하며, 한국어 문서를 제공해 국내 개발자들이 쉽게 접근할 수 있다. WICWIU는 Apache 2.0 라이선스를 적용해 어떠한 연구 목적 및 상용 목적으로도 자유롭게 활용할 수 있다.
웹 기반 초고속 신약 후보물질 탐색-계산 시스템 구현
조성호, 김인희, 공지원, 김대산, 권남훈, 로버트 E. 베리어, 김성훈
http://doi.org/10.5626/JOK.2019.46.3.260
이 논문에서는 nanoluciferase 시스템의 생화학 반응 과정에서 도출한 데이터를 고속으로 계산하고 신약 후보물질을 신속히 찾아내도록 보조하는 웹 기반 초고속 계산-탐색 시스템(HTSCS) 개발 결과물을 설명한다. 이 시스템에서는 단일 농도(Single-Dose)와 다중 농도(Multi-Dose)로 세포 실험체에 후보물질을 투여(in-vitro)한 대량의 실험 데이터를 계산하여, 차트 및 그래프 정보로 나타낸다. 따라서 HTSCS 시스템으로 신약 후보물질 발견에 필요한 시간과 노력을 줄일 수 있다.
무선 환경에서 HTTP 적응적 스트리밍의 QoE 향상을 위한 안정성 기반의 품질 적응 기법
http://doi.org/10.5626/JOK.2019.46.3.268
최근, 네트워크의 발전으로 비디오 스트리밍에 대한 수요가 증가하면서 HTTP 적응적 스트리밍(HTTP Adaptive Streaming)이 주목받고 있다. HTTP 적응적 스트리밍은 클라이언트가 네트워크 상황에 적응적으로 품질을 선택하기 때문에 QoE(Quality of Experience)를 보장할 수 있다. 그러나, 무선환경에서는 높은 지연과 패킷 손실률로 인해 대역폭이 부정확하게 측정된다. 기존의 품질 적응 기법들은 측정된 대역폭을 이용해 품질을 선택하기 때문에 QoE가 저하되는 문제가 있다. 본 논문에서는 무선 환경에서 HTTP 적응적 스트리밍의 QoE 향상을 위한 안정성 기반의 품질 적응 기법을 제안한다. 제안하는 기법은 요청 품질과 버퍼의 변화를 이용해 재생 끊김 확률과 불안정성을 계산하고 품질 적응 영역에 따라 품질을 다르게 선택한다. 실험 결과, 제안하는 기법이 기존 기법들과 비교해 적은 품질 변경과 높은 평균비디오 품질로 QoE를 향상시키는 것을 확인하였다.
VANET에서 RSU에 의존적이지 않은 CRT-기반 그룹키를 이용한 메시지 인증 기법
http://doi.org/10.5626/JOK.2019.46.3.277
VANET을 통해 전송되는 정보는 운전자의 안전과 직결될 수 있으므로 통신에 있어서 보안은 여전히 중요한 문제이다. 기존의 많은 연구에서는 RSU를 신뢰 또는 준신뢰 장비로 인식하고 메시지 검증에 중요한 역할을 RSU가 담당하였다. 그러나 많은 수의 RSU를 준 신뢰 장비로 인식하기에는 RSU의 보안에 대한 안전성을 담보할 수가 없다. 따라서 본 연구에서는 RSU에 의존적이지 않은 CRT(Chinese Remainder Theorem)-기반의 그룹키를 이용한 메시지 인증기법을 제안한다. 제안 기법은 CRT-기반 키서버가 각 차량에 개인키 및 그룹키 씨드를 계산하여 배포하면 각 차량은 그룹키 씨드 값에서 그룹키를 추출하여 메시지 인증에 사용한다. 제안기법은 메시지 검증에서의 RSU 의존도를 제거하였으며 문제 차량의 개별적 철회가 가능한 장점이 있다.
문장 임베딩 기반 텍스트랭크를 이용한 문서 요약
http://doi.org/10.5626/JOK.2019.46.3.285
문서 요약은 원본 문서가 가진 주요 내용을 유지하는 축약된 크기의 문서를 만들어내는 것이다. 추출 요약은 원문에서 많은 양의 텍스트를 복사하는 것으로 문법과 정확성의 기본 수준을 보장받을 수 있어 과거부터 활발히 연구되어 왔다. 추출 요약에 사용되는 대표적 방법인 텍스트랭크는 단어의 빈도를 통해 그래프의 간선을 계산하므로 문장이 가진 의미적인 정도를 고려하기 어렵다. 이러한 단점을 해결하기 위해 본 논문에서는 문장 임베딩을 사용하는 새로운 텍스트랭크를 제안한다. 다양한 임베딩 평가를 통해 제안 방법이 일반적인 텍스트랭크 방법보다 문장의 의미를 잘 고려한 결과를 출력한다는 것을 확인하였다.