48권 7호,
7월 2021
디지털 라이브러리
NUMA의 특성을 고려한 원격 퍼시스턴트 메모리 디스어그리게이션
http://doi.org/10.5626/JOK.2021.48.7.735
데이터 센터 등 대규모 시스템에서 효율적인 리소스 관리를 위해 자원이 중심이 되는 디스어그리게이션 방법이 사용되고 있고 각 서버는 다수의 소켓을 가지는 NUMA 구조로 구성된다. NUMA 구조에서는 메모리의 원격 접근과 로컬 접근의 지연시간의 차이가 크고 이는 퍼시스턴트 메모리에서 더 크게 나타난다. 본 연구에서는 퍼시스턴트 메모리 디스어그리게이션 시스템에서 NUMA 구조의 로컬성을 고려하여 원격 NUMA 노드 메모리에 접근하는 수를 줄이는 메모리 디스어그리게이션 프레임워크 Xpass를 설계한다. Xpass는 캐싱한 페이지를 관리하기 위해 동적 해시 테이블 CCEH를 사용하며, NUMA 환경에서 NUMA 노드 간 로드 밸런싱을 고려하는 세그먼트 스플릿 알고리즘을 제안한다.
Opt Tree: Optane DCPM 내부 버퍼를 활용한 쓰기 최적화 트리
http://doi.org/10.5626/JOK.2021.48.7.742
최근 상용화된 비휘발성 메모리인 Intel사의 Optane DC Persistent Memory는 캐시 라인 단위 또는 워드 단위의 메모리 접근 명령을 256바이트 단위로 처리하는 내부 버퍼가 존재한다. 본 논문에서는 Optane DCPM의 내부 버퍼를 활용하는 인덱스인 Opt Tree를 제안한다. Opt Tree는 트리의 노드를 256 바이트 단위의 여러 작은 블록으로 나누어 노드 내의 데이터들을 분할 저장하며, 노드 접근 시에는 2개의 블록만을 접근하는 삽입 및 탐색 알고리즘을 가진다. Opt Tree는 Optane DCPM의 내부 버퍼에 친화적인 디자인과 알고리즘을 바탕으로 기존의 비휘발성 메모리를 위한 인덱스들보다 더 나은 삽입 성능을 보여준다.
실시간 전역조명을 위한 프리미티브와 복셀 기반의 하이브리드 추적 기법
http://doi.org/10.5626/JOK.2021.48.7.748
희소옥트리 기반의 복셀콘추적 렌더링 알고리즘은 전역 조명에 필요한 정보를 볼륨에 저장하고, 복셀콘추적을 통해 간접 확산과 반사 효과를 효율적으로 계산할 수 있다. 그러나 거울 정반사와 같이 고해상도가 필요한 경우에 복셀콘추적은 현격한 메모리와 연산을 필요로 한다. 본 연구는 희소옥트리의 잎노드에서 프리미티브가 밀집되지 않은 경우는 프리미티브 목록을 사용하고, 밀집된 경우는 추가 복셀화를 수행하는 하이브리드 옥트리와 콘추적과 광선추적을 노드 형태에 따라 적응적으로 수행하는 하이브리드 추적 기법을 제안한다. 본 기법은 고품질 간접조명을 복셀콘추적보다 빠르게 실시간에 수행할 수 있다.
GPU 기반 고정밀 적응형 정점 깊이 렌더링
http://doi.org/10.5626/JOK.2021.48.7.756
Z-버퍼 알고리즘은 현대 3D 그래픽스 파이프라인에서 가시성 결정에 사용되는 표준 기법이지만, 정밀도의 한계로 인해 Z-fighting 현상이 발생할 수 있다. 기존의 CPU 기반 객체별 투영 행렬 재구성은 해당 현상을 완화할 수 있지만, 객체별로 반복하는 행렬 재구성과 렌더링 커맨드는 복잡한 장면에서 렌더링 파이프라인의 지연을 발생시킨다. 이에 본 논문은 GPU 기반 고정밀 적응형 정점 깊이 렌더링 기법을 소개한다. 제안하는 기법은 CPU 기반 객체별 투영 행렬 재구성 대신 GPU의 정점 셰이더에서 정점별 클립 공간 z축 미세조정을 진행한다. 미세조정된 정점은 렌더링 파이프라인을 통과하며 객체에 위치에 따라 적응적으로 편향된 깊이 값을 생성한다. 본 기법은 깊이 정밀도와 관련된 GPU 폐색 컬링 및 그림자 매핑 기법 등에 응용될 수 있다.
기계학습을 활용한 경기도 산업단지 미세먼지 예측
http://doi.org/10.5626/JOK.2021.48.7.764
최근 미세먼지의 다양한 예측 모델들을 통한 연구가 이루어지고 있지만 현재 PM10 농도 예측에 치중되어 있어 PM2.5 농도를 예측할 수 있는 모델 개발이 필요한 상황이다. 본 논문은 최근 약 2년간의 반월시화국가산업단지의 대기질, 기상, 교통 데이터를 수집하여 미세먼지(PM2.5)와 미세먼지(PM10), 이산화황(SO₂), 이산화질소(NO₂), 일산화탄소(CO), 오존(O₃), 온도, 습도, 풍향, 풍속, 강수량, 도로 구간별 차량속도 변수간의 상관관계 분석 및 회귀분석을 통해 변수의 유의성을 파악하고, 산업단지의 시간대별 PM2.5를 예측하는 데 활용하였다. 인공지능 기반의 Random Forest, XGBoost, LightGBM, Deep neural network과 Voting 모델을 통해 산업단지의 시간별 PM2.5 농도를 예측하고, RMSE를 기준으로 비교분석을 진행하였다. 예측 결과 RMSE는 각각 6.27, 6.41, 6.22, 6.64, 6.12로 각 모델 모두 에어코리아에서 예측하는 모델의 10.77에 비해 매우 높은 성능을 보여주었다.
Alpha-Integration Pooling for Convolutional Neural Networks
http://doi.org/10.5626/JOK.2021.48.7.774
컨볼루션 뉴럴 네트워크(CNN)는 이미지 인식을 비롯한 많은 애플리케이션에서 놀라운 성능을 보여주고 있다. CNN의 주요 요소 중 하나인 서브 샘플링은 효율적인 학습과 불변성에 중요한 역할을 하며, 일반적으로 최대풀링과 평균풀링이 많이 사용된다. 두 방법 외에도 기하 평균, 조화 평균 등과 같은 다른 풀링 유형들이 존재할 수 있다. 여러 풀링 유형들 중에 최적의 유형을 자동으로 찾기가 어렵기 때문에 특정 유형이 사전에 선택되어 사용되고 이는 주어진 문제에서 최적의 유형이 아닐 수 있다. 하지만, 딥러닝의 다른 변수들과 마찬가지로, 주어진 문제에서 데이터로부터 풀링 유형을 학습할 수 있다. 본 논문은 학습 가능한 파라미터 α를 통해 풀링 유형을 찾아내는 알파-인테그레이션 풀링(αI-pooling)을 제안한다. αI-pooling은 파라미터 α에 따라 최대풀링과 평균풀링 등을 특수 케이스로 포함하는 일반화된 풀링 방법이다. 실험을 통해 이미지 인식 문제에서 αI-pooling의 성능이 다른 풀링 유형들을 능가함을 보였다. 또한, 각각 레이어가 다른 최적의 풀링 유형을 가지고 있음을 확인했다.
모션-스피어 궤적데이터 기반의 동적제스처 인식 시스템
http://doi.org/10.5626/JOK.2021.48.7.781
최근 인간과 컴퓨터의 상호작용(HCI)에 속하는 동적제스처 인식 기술은 많은 관심을 받고 있다. 이는 해당 시스템을 활용하기 위한 인터페이스 구성이 간단하고, 빠른 의사소통이 가능하기 때문이다. 본 논문에서는 동적제스처 인식 시스템에 새로운 입력데이터를 사용하고, 인식정확도를 개선시키기 위한 연구를 진행했다. 기존 동적제스처 인식시스템에서는 주로 관절의 위치와 회전데이터를 사용한다. 반면 제안하는 시스템에서 모션-스피어의 궤적데이터를 사용한다. 모션-스피어는 움직임을 시각화하기 위한 기술로서 직관적으로 움직임을 표현한다. 모션-스피어는 동작을 궤적과 꺾임 각도가 표현하고, 모션-스피어의 궤적은 동적제스처 인식시스템의 입력데이터로 사용가능하다. 본 논문에서는 궤적데이터 사용의 유효성을 동적제스처 인식정확도 비교를 통해서 검증한다. 실험에서는 직접 사용자의 움직임을 쿼터니온데이터로 측정한 실험과 공개 모션데이터를 사용한 실험으로 나눈다. 두 시스템에서 모두 인식정확도 테스트를 진행했고, 각 실험에서 모두 높은 인식정확도를 도출했다.
데이터 분포의 균형화를 이용한 한국어 텍스트의 차원적 감성 분석
http://doi.org/10.5626/JOK.2021.48.7.790
텍스트 혹은 발화의 감정을 연속적인 수치로 회귀하는 차원적 감성 분석 연구는 데이터의 부족으로 인해 감정을 범주로 분류하는 범주적 감성 분석 연구에 비해 많은 연구가 이루어지지 못하였다. 최근 한국정보화진흥원의 AI Hub를 통해 공개된 ‘멀티모달 영상 데이터’는 한국어의 차원적 감성 분석 연구에 활용할 수 있는 공공 데이터이다. 본 연구에서는 자연어 처리에서 전형적으로 쓰여 온 딥 러닝 모델인 중 하나인 CNN을 이용해 한국어의 차원적 감성 분석을 시도하였다. 또한 데이터의 분포를 균형적으로 조정함으로써 모델의 성능이 향상되는지 검증하였다. 실험 결과 모델들은 기존의 영어 연구와 비슷한 성능을 보여 한국어 텍스트의 차원적 감성 분석 연구에서 ‘멀티모달 영상 데이터’가 효용성을 지님을 알 수 있었다. 또한 데이터를 균형화함으로써 더 적은 학습 데이터를 이용해 학습한 모델이 더 좋은 성능을 보일 수 있음을 확인하였다.
상대방 화자의 상태 문맥을 파악해 대화에서 화자의 감정을 인식하는 RNN 모델
http://doi.org/10.5626/JOK.2021.48.7.802
감정 분석은 인공지능 분야에서 지속적으로 관심을 받고 있는 주제이다. 본 연구에서는 RNN 모델을 통해 대화 내에서 발화를 통해 나타나는 특정 화자의 감정을 분석하고 파악한다. 대화(dialogue)에는 화자(speaker)를 두 가지 문맥 정보가 있는데, 하나는 해당 화자의 문맥 정보(self-dependency)이고 다른 하나는 해당화자와 상대방 화자 간의 문맥 정보(inter-speaker dependency)이다. 특히, 상대방 화자의 상태 문맥 정보가 현재 화자의 감정에 끼칠 수 있는 영향(inter-speaker dependency)을 고려하여 감정을 분석한다. 이를 위해, 기존의 DialogueRNN 모델에서 상대방의 상태 문맥을 파악할 수 있는 GRU(Gated Recurrent Unit) Cell을 하나 추가한 모델을 제안한다. 본 연구에서 제안하는 모델이 기존의 DialogueRNN 모델 및 3가지 변형 모델과 비교했을 때, 더 높은 성능을 보였다.
시맨틱 얼굴 변형을 이용한 심층신경망 공격과 강건성 향상
http://doi.org/10.5626/JOK.2021.48.7.809
심층신경망은 자율 주행, 얼굴 인식, 물체 탐지 등 다양한 분야에서 널리 쓰이고 있다. 하지만 누군가 악의적인 의도로 심층신경망의 입력을 교란시키면, 잘 학습된 신경망도 오작동 할 수 있다. 일반적인 공격 방법은 이미지의 픽셀 공간에 교란을 추가하여 이미지를 조작한다. 그러나 픽셀 기반의 변형은 쉽게 사람의 눈에 띌 수 있기 때문에 현실적인 효과적 공격은 이미지를 부자연스럽게 변형하여 네트워크를 교란시키는 방법이라 할 수 있다. 본 논문에서는 얼굴 이미지의 부위별 분할을 통해 자연스러운 색감 변형을 이용한 새로운 공격 방법을 제안한다. 시맨틱 얼굴 변형(Semantic face transformation) 기반 이미지를 생성하였으며, 이를 통해 심층신경망 이미지분류의 정확도를 낮출 수 있음을 검증하였다. 또한 우리 방법으로 생성된 변형 이미지를 이용하여, 강건성 훈련한 후 신경망의 강건성을 향상시킬 수 있음을 검증하였다.
감정 분석을 위한 BERT 사전학습모델과 추가 자질 모델의 결합
http://doi.org/10.5626/JOK.2021.48.7.815
대규모 코퍼스에 기반한 사전학습모델인 BERT 모델은 언어 모델링을 통해 텍스트 내의 다양한 언어 정보를 학습할 수 있다고 알려져 있다. 여기에는 별도의 언어 자질이 요구되지 않으나, 몇몇 연구에서 특정한 언어 지식을 추가 반영한 BERT 기반 모델이 해당 지식과 관련된 자연어처리 문제에서 더 높은 성능을 보고하였다. 본 연구에서는 감정 분석 성능을 높이기 위한 방법으로 한국어 감정 사전에 주석된 감정 극성과 강도 값을 이용해 감정 자질 임베딩을 구성하고 이를 보편적 목적의 BERT 모델과 결합하는 외적 결합과 지식 증류 방식을 제안한다. 감정 자질 모델은 작은 스케일의 BERT 모델을 적은 스텝 수로 학습하여 소요 시간과 비용을 줄이고자 했으며, 외적 결합된 모델들은 영화평 분류와 악플 탐지문제에서 사전학습모델의 단독 성능보다 향상된 결과를 보였다. 또한 본 연구는 기존의 BERT 모델 구조에 추가된 감정 자질이 언어 모델링 및 감정 분석의 성능을 개선시킨다는 것을 관찰하였다.
EFA-DTI: Edge Feature Attention을 활용한 약물-표적 상호작용 예측
에르햄바야르 자담바, 김수헌, 이현수, 김화종
http://doi.org/10.5626/JOK.2021.48.7.825
신약개발은 의약 화학, 시스템 및 구조 생물학, 더 나아가 인공지능에 이르기까지 다양한 학문을 필요로 하기 때문에 난이도가 높은 분야라고 할 수 있다. 특히, 약물-표적 상호작용(DTI) 예측은 방대한 양의 화합물로부터 질병을 치료할 수 있는 후보 물질을 도출해내는 과정으로, 신약 개발 과정에 있어 핵심 요소다. 최근에는 컴퓨터 성능이 비약적으로 발전함에 따라, DTI 예측에 소요되는 여러 측면의 비용을 줄이고자 인공지능 신경망을 활용하는 연구가 활발히 진행되고 있다. 따라서, 본 논문에서는 Edge Feature Attention을 적용한 Graph Net Embedding 및 Fingerprint를 활용한 약물 표현 생성과 ProtTrans를 활용한 단백질 표현 생성을 통해 약물과 표적 단백질 간의 상호작용 수치를 예측하는 모델을 제안한다. 해당 모델은 기존의 DTI 연구에서 가장 좋은 성능을 보였던 DeepDTA, GraphDTA보다 높은 성능을 달성하였으며, 이에 대한 실험 및 결과를 기술하였다.
RocksDB의 컬럼 패밀리 간 성능간섭 현상 분석
http://doi.org/10.5626/JOK.2021.48.7.835
대표적인 LSM-tree 기반 키-밸류 스토어인 RocksDB는 클라이언트가 데이터의 특성에 따라 키-밸류들을 분류할 수 있도록 컬럼 패밀리 기능을 제공한다. 각 컬럼 패밀리는 독립적인 쓰기 버퍼를 가지고 분류된 키-밸류들을 관리하지만 데이터 일관성을 위해 WAL 파일은 공유한다. 하지만, 이러한 WAL 파일을 공유하는 구조는 컬럼 패밀리 간의 성능간섭을 유발하여 RocksDB의 쓰기 성능을 저하시킬 수 있다. 본 논문에서는 컬럼 패밀리 간 성능간섭으로 인한 RocksDB의 성능 저하 원인을 분석한다. 이를 위해 WAL 파일의 크기와 컬럼 패밀리의 수에 따른 RocksDB의 쓰기 성능을 측정하고 그 결과를 분석하였다. 실험 결과를 보면 RocksDB에서 구성된 컬럼 패밀리의 수와 WAL 파일의 크기에 따라 쓰기 성능이 최대 57.08%까지 감소하는 것을 확인할 수 있다.
유전자 임베딩을 이용한 암 예후 예측 방법
http://doi.org/10.5626/JOK.2021.48.7.842
암의 예후와 관련이 있는 유전자를 식별하고 이를 이용하여 암환자의 예후를 예측하는 것은 환자에게 효과적인 치료방법을 제공하는데 기여하는 바가 크다. 유전자 발현 데이터를 이용하여 예후 관련 유전자를 탐색하거나 암의 예후를 예측하기 위한 다양한 연구방법들이 제시되었으며, 최근에는 딥러닝을 비롯한 머신러닝 기법들이 집중적으로 연구되고 있다. 하지만 유전자 발현량 데이터에 기계학습 방법을 적용하는 것은 사용 가능한 샘플의 수가 적고 유전자의 수가 많다는 근본적인 문제가 있다. 본 연구에서는 유전자 네트워크 데이터를 추가적으로 사용하여, 많은 수의 무작위 유전자 경로를 학습 데이터 사용함으로써 적은 수의 샘플이라는 문제를 보완하고자 한다. 본 연구에서 제시하는 방법을 이용하여 5가지 암에 대한 유전자 발현 데이터와 유전자 네트워크를 이용하여 예후 특이적 유전자를 식별하고 환자의 예후를 예측한 결과, 다른 기존 방법들과 비교하여 높은 정확도로 예측을 하는 것을 확인할 수 있었으며, 적은 샘플을 사용한 예측에서 높은 성능을 확인할 수 있었다.
웹 오브젝트 의존성 기반 HTTP/3 스트림 우선순위 선정 기법
http://doi.org/10.5626/JOK.2021.48.7.850
현대 웹의 요구에 부응하는 새로운 기능을 포함하는 응용 계층 프로토콜인 HTTP/3가 IETF 표준화 마무리 단계에 있다. HTTP/3의 전송 계층 수준 스트림 다중화로 인해 한 연결 내에 여러 스트림 중 어떤 것을 먼저 전송할지 정하는 스트림 우선순위 선정 문제가 등장하였으며 이는 웹 오브젝트들의 전송 완료 시간에 영향을 준다. 한편, 브라우저에서의 세부 연산인 웹 활동 간에는 의존성 관계가 존재하는데, 이는 각 웹 활동에 필요한 웹 오브젝트 간에도 의존성 관계가 있음을 의미한다. 본 논문은 브라우저에서의 페이지 로드 과정에 부합하는 웹 오브젝트 전송을 위해, 웹 오브젝트 간 의존성을 고려하여 HTTP/3 스트림에 우선순위를 선정하는 방법을 제안한다. 또한, HTTP/3 라이브러리 수준의 평가가 아닌, 브라우저 기반의 테스트베드를 구축하고 이를 바탕으로 제안 기법을 평가하여 본 기법의 적용이 사용자 경험 지표를 향상시킬 수 있음을 보였다.