Model-Based Reinforcement Learning with World Models
- 2025년 12월 5일 오후 3:54
- 조회수: 10
INFORMATION
- 2025년 12월 5일
- 오후 12시 ~
- 고려대학교 신공학관 218호
온라인 비디오 시청 (YouTube)
발표자:
정재우
정재우
TOPIC
Model-Based Reinforcement Learning with World Models
On-Line Video
OVERVIEW
요약:
월드 모델(World Model)은 기존 강화학습의 샘플 비효율성을 개선하고, 더욱 지능적인 에이전트 학습을 가능하게 하는 모델 기반 강화학습 (Model-Based Reinforcement Learning, MBRL)의 핵심 분야이다. 위 방법론은 에이전트가 환경과 상호작용하며 수집한 경험 데이터를 바탕으로, 환경의 역학 (dynamics)을 학습하여 환경을 시뮬레이션할 수 있는 내부 모델을 구축하는 것을 학습 목표로 설정한다.
이러한 환경 모델링을 통해 강화학습의 에이전트는 실제 환경과의 상호작용 없이 가상의 경험을 무한히 생성하고, 이 가상 경험을 통해 행동 정책을 학습하거나 계획 (planning)을 수행할 수 있으며, 이는 실제 환경 데이터를 활용한 학습량을 획기적으로 줄여 샘플 효율성을 극대화한다.
이번 세미나에서는 월드 모델의 기본 개념, 모델 학습 방법론, 그리고 발전된 연구들을 소개하고자 한다.
참고자료:
[1] Ha, D., & Schmidhuber, J. (2018). World Models. In arXiv preprint arXiv:1803.10122.[2] Hafner, D., Lillicrap, T., Ba, J., & Norouzi, M. (2020). Dream to Control: Learning Behaviors by Latent Imagination. In International Conference on Learning Representations (ICLR).