디지털 라이브러리[ 검색결과 ]
정책 기반 강화학습에서의 효율적 탐색을 위한 행동 선택 기법 및 동적 밀집 보상 적용 연구
http://doi.org/10.5626/JOK.2025.52.4.293
오늘날 강화학습은 자율주행, 로봇, 게임 등 다양한 분야에서 연구 및 활용되고 있다. 강화학습은 에이전트가 환경과 상호작용하며 최적의 행동 정책을 찾는 것을 목표로 하며, 환경과 문제에 따라 정책 기반 알고리즘과 가치 기반 알고리즘 중 더 적절한 알고리즘이 선택되어 사용된다. 정책 기반 알고리즘은 연속적이고 고차원적인 행동 공간에서 효과적인 학습이 가능하지만, 학습률 파라미터가 학습에 미치는 영향이 크고, 복잡한 환경일수록 최적화된 정책의 수렴 난도가 상승하는 문제점이 존재한다. 본 논문에서는 이러한 문제점을 해결하고자 어닐링 알고리즘을 기반한 행동 선택 기법 및 동적 밀집 보상 설계를 제안한다. 제안된 방식을 두 가지 대표적인 정책 기반 알고리즘인 A2C 알고리즘과 PPO 알고리즘에 적용하여 실험을 진행하였고, 실험 결과, 제안된 방식을 적용한 두 강화학습 알고리즘이 기존 강화학습 알고리즘 대비, 더 높은 성능을 보였다.
사물 인터넷 환경에서의 소프트웨어 정의 네트워크 기반 이동성 관리
문보영, 조승철, 손사민, 김현숙, 김청빈, 김준혁, 한선영
http://doi.org/10.5626/JOK.2018.45.7.733
IoT 환경에서는 사물 주소, 배터리, 네트워크 대역폭, 컴퓨팅 파워 등의 다양한 제약을 받게된다. 이동성 관리 측면에서도 프로토콜이 복잡하면 이동하는 IoT 단말기에게 큰 부하를 준다. 본 논문에서는 이동하는 IoT 단말기의 문제점을 효과적으로 해결하기 위해 SDN(Software Defined Networking)의 중앙집중형 관리 방식을 적용한 이동성 관리 시스템을 제안한다. SDN은 프로그래밍이 가능하기 때문에 IoT 단말의 확장성 및 관리가 용이하다. IoT를 위한 SDN기반 이동성 구조를 제시하고 이 구조를 이용하여 시스템을 설계 및 테스트 베드를 구축하여 구현하였다.