디지털 라이브러리[ 검색결과 ]
관계적 메모리 코어 구조를 적용한 변분적 순환신경망
http://doi.org/10.5626/JOK.2020.47.2.189
순차적 데이터(sequential data)를 위한 생성모델(generative model) 학습을 위해서 순환신경망(RNN; recurrent neural network) 기반의 모델들이 제안되고 있는 가운데, 순환신경망에 변분오토인코더(VAE; variational autoencoder) 의 요소를 도입하여 복잡한 순차적 데이터 분포를 표현 가능하게 하는 변분적 순환신경망(VRNN; variational recurrent neural network)이 제시된 바 있다. 한편, 최근 셀프어텐션(self-attention) 기반의 메모리 구조를 RNN에 도입하여 입력 간의 관계를 고려할 수 있는 구조를 가진 관계적 메모리 코어(RMC; relational memory core)가 제안되어 순차적 데이터 처리에 있어서 성능을 높인 바 있다. 이 논문에서는 관계적 메모리 코어 구조를 VRNN에 도입해 순차적 입력데이터들 간에 한층 심화된 관계적 추론을 가능하게 하는 모델인 변분-관계적 메모리 코어(VRMC; varitional relational memory core)를 제안한다. 또한, 음악생성 데이터 기반의 실험을 통해 기존 VRNN보다 비해 성능이 나아짐을 보이고 이를 통해 본 연구에서 제시한 모델이 순차적 데이터를 모델링하는 데 있어서 더 효과적임을 보이려 한다.
사전확률 갱신을 수행하는 교차 엔트로피 계획법
http://doi.org/10.5626/JOK.2020.47.1.88
본 논문에서는 사전확률 갱신을 수행하는 교차 엔트로피 계획법에 관해 기술한다. 교차 엔트로피 계획법은 실시간 계획법(online planning)에서 많이 사용하는 방법론으로 가상환경으로부터 표본(sample)을 추출하고 추출된 표본으로부터 평가된 가치를 기반으로 최적의 행동(action)을 선택한다. 기존 교차 엔트로피 계획법은 최적화 과정에서 이전에 얻어진 탐색결과를 활용하지 않고 매번 새롭게 탐색을 수행한다. 따라서 정해진 시간 내에 탐색을 수행해야 할 경우, 도달할 수 있는 성능이 제한되어 있다. 본 논문에서는 행동 차원에 대한 교차 엔트로피 계획법의 결과물을 활용하여 최적화 과정에서의 사전확률을 갱신하고, 이를 통해 점차 높은 성능을 보일 수 있는 방법론을 제안한다. 또한, 실험에서는 물리 기반 가상환경(OpenAI Gym)에서 교차 엔트로피 계획법과 비교를 통해 제안된 방법론을 평가한다.