디지털 라이브러리[ 검색결과 ]
인테리어 디자인 가이드라인과 근위 정책 최적화를 사용한 인테리어 디자인 자동화 모델
http://doi.org/10.5626/JOK.2024.51.6.519
주거 공간의 인테리어 디자인은 입주자의 만족도와 인상에 큰 영향을 미치는 작업이다. 그러나 인테리어 디자인은 전문적인 디자인 지식이 필요하기 때문에 쉽게 접근하기 어렵다. 따라서 인테리어 디자 인을 자동화하기 위한 최적화 및 딥 러닝 방법이 제안되었다. 그럼에도 불구하고 이 기술들은 문제를 해결 하는데 많은 시간이 걸리거나, 학습 데이터를 확보해야 한다는 어려움이 있다. 본 논문에서는 심층 강화학 습을 이용한 인테리어 디자인 자동화 모델을 제안한다. 강화 학습은 에이전트가 환경과 상호 작용하며 누 적 보상을 최대화하는 정책을 학습하기 때문에 학습 데이터 확보 과정을 생략할 수 있다. 인테리어 디자인 가이드라인을 보상 함수로 설계하여 기능적, 시각적 기준을 만족하는 인테리어 레이아웃을 생성한다. 강화 학습 에이전트는 PPO를 사용해 연속 위치에 가구를 배치한다. 가구와 방의 조합에 따른 보상 비교 실험 과 보상 함수의 조합에 따른 디자인 비교 실험으로 제안하는 모델의 성능을 평가한다.
심층강화학습 기반 MCS 결정 알고리즘
http://doi.org/10.5626/JOK.2022.49.8.663
무선 이동 통신 시스템에서는 채널의 처리량, 주파수 효율 등을 높이기 위해 링크 적응 기법을 적용하여 채널 상태의 변화에 따라 전송 파라미터를 적응적으로 조절한다. 적응적 변조 및 코딩은 채널의 상태에 따라 미리 정의된 변조 및 코딩 방식을 결정하는 링크 적응 기법으로 단말이 보고한 CQI와 패킷 전송에 대한 HARQ 피드백을 기반으로 수행된다. 본 논문에서는 적응적 변조 및 코딩에 심층강화학습을 적용한 MCS 결정 모델을 제안한다. 제안하는 모델은 동적으로 변화하는 네트워크 망에서 적응적으로 MCS 레벨을 결정하여 단말의 전송 효율을 높인다. 본 논문에서는 제안하는 모델의 성능을 단말 로그 기반의 시뮬레이션을 통해 평가하였으며, 이를 통해 제안하는 모델이 기존의 외루프 전송률 제어 기법보다 높은 성능을 보인다는 것을 확인하였다.
현실 제약 조건을 반영한 강화학습 기반 교통 신호 제어
http://doi.org/10.5626/JOK.2021.48.8.871
교통 신호 제어는 도로의 한정된 용량을 효율적으로 사용하기 위해 중요한 역할을 한다. 전통적인 교통 신호 제어 방법은 미리 설정된 신호를 기반으로 운영되기 때문에 수시로 변하는 교통 상황에 대응하기 어렵다. 최근에 복잡한 문제를 해결하기 위한 방법으로 강화학습이 주목을 받으면서 효율적인 교통 신호 제어를 위해 강화학습을 사용하는 연구가 진행되고 있다. 전통적인 방법과 비교하여 대기 시간이나 여행 시간이 개선되는 것을 시뮬레이션을 통해 입증하였으나 대부분의 연구가 실제 신호의 제약조건을 반영하지 않아 현실에 적용하기에는 부적합하게 설계되어 있다. 본 논문에서는 현실에 존재하는 신호 운영체계의 제약조건을 반영하여 비교적 현실 적용 가능하며 교통량 변화에 대응할 수 있는 강화학습 기반의 신호 제어 방법을 제안한다.
커리큘럼 러닝을 이용한 항공기 강화학습
http://doi.org/10.5626/JOK.2021.48.6.707
전 세계적으로 무인 항공기 제어를 위한 다양한 알고리즘이 제안되었지만 탐색시간, 불명확한 규칙 등의 제한사항이 있었다. 이를 극복하기 위하여 본 연구에서는 심층 강화학습을 이용한 제어 기법을 적용하고 효과적인 학습을 위하여 조준각도(ATA) 기반의 커리큘럼 러닝을 제안한다. 제안한 기법의 효용성을 확인하기 위하여 항공기 질점 6-자유도 모델을 적용한 3차원 시뮬레이션 환경을 구축하고 두 항공기가 서로 뒤돌아 보고 있는 상황에서 격추하는 시나리오를 학습하였다. 그 결과 커리큘럼 러닝을 적용하지 않았을 경우 ATA 60° 이상은 제한된 시간에 학습이 완료되지 않은 것이 반해 ATA 기반 커리큘럼 러닝을 적용한 경우에는 별도의 보상함수 추가 없이 180°까지 학습이 완료되는 것을 확인하였다.
심층 강화학습 기반 다중경로 패킷 스케줄링 기법 연구
http://doi.org/10.5626/JOK.2019.46.7.714
다중경로 전송 환경에서 패킷 스케줄링은 여러 경로를 통해 데이터를 전송함으로써 늘어난 네트워킹 자원의 활용 정책을 결정하는 것으로 전체 네트워킹 성능에 영향을 미치는 주된 요소 중 하나이다. 하지만 기존의 고정된 성능 척도에 기반한 패킷 스케줄링 기법은 네트워크 상황 변화에 따라 적응적인 동작이 어려워 제한된 성능을 보인다는 한계가 있다. 본 논문에서는 심층 강화학습을 도입하여 네트워크 상황에 적응적인 동작이 가능한 패킷 스케줄러를 제안한다. 이를 위해 다중경로 전송 네트워킹 기술과 연동된 패킷 스케줄러 구조와 자율적으로 네트워크 상황의 변화를 탐지하여 학습하는 심층 강화학습 모델을 설계한다. 다중경로 전송을 위해 확장된 QUIC(Quick UDP Internet Connections) 프로토콜을 활용한 구현과 에뮬레이션 기반의 실험을 통해 제안한 패킷 스케줄링 기법과 자율제어 네트워킹의 가능성을 확인한다.