사전확률 갱신을 수행하는 교차 엔트로피 계획법 


47권  1호, pp. 88-94, 1월  2020
10.5626/JOK.2020.47.1.88


PDF

  요약

본 논문에서는 사전확률 갱신을 수행하는 교차 엔트로피 계획법에 관해 기술한다. 교차 엔트로피 계획법은 실시간 계획법(online planning)에서 많이 사용하는 방법론으로 가상환경으로부터 표본(sample)을 추출하고 추출된 표본으로부터 평가된 가치를 기반으로 최적의 행동(action)을 선택한다. 기존 교차 엔트로피 계획법은 최적화 과정에서 이전에 얻어진 탐색결과를 활용하지 않고 매번 새롭게 탐색을 수행한다. 따라서 정해진 시간 내에 탐색을 수행해야 할 경우, 도달할 수 있는 성능이 제한되어 있다. 본 논문에서는 행동 차원에 대한 교차 엔트로피 계획법의 결과물을 활용하여 최적화 과정에서의 사전확률을 갱신하고, 이를 통해 점차 높은 성능을 보일 수 있는 방법론을 제안한다. 또한, 실험에서는 물리 기반 가상환경(OpenAI Gym)에서 교차 엔트로피 계획법과 비교를 통해 제안된 방법론을 평가한다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

H. Hwang, Y. Jang, J. Park, K. Kim, "Cross-Entropy Planning with Prior Updates," Journal of KIISE, JOK, vol. 47, no. 1, pp. 88-94, 2020. DOI: 10.5626/JOK.2020.47.1.88.


[ACM Style]

HyeongJoo Hwang, Youngsoo Jang, Jaeyoung Park, and Kee-Eung Kim. 2020. Cross-Entropy Planning with Prior Updates. Journal of KIISE, JOK, 47, 1, (2020), 88-94. DOI: 10.5626/JOK.2020.47.1.88.


[KCI Style]

황형주, 장영수, 박재영, 김기응, "사전확률 갱신을 수행하는 교차 엔트로피 계획법," 한국정보과학회 논문지, 제47권, 제1호, 88~94쪽, 2020. DOI: 10.5626/JOK.2020.47.1.88.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr