[강화 학습] ACER(Actor-Critic with Experience Replay) 개념 정리
·
2. 자료구조와 알고리즘/2-2 강화학습 알고리즘
GitHub - gonida1010/CartPole-ACER-OffPolicy: OpenAI Gym의 CartPole 환경에 적용한 ACER (Actor-Critic with Experience ReplaOpenAI Gym의 CartPole 환경에 적용한 ACER (Actor-Critic with Experience Replay) 알고리즘의 PyTorch 구현체입니다. 이 저장소는 교육 목적으로 작성되었으며, Actor-Critic 기법의 학습 안정성과 경험 재생(Experience Rgithub.com1. ACER의 등장 배경: 기존 알고리즘의 한계ACER를 이해하려면 기존 Actor-Critic 계열 알고리즘(A2C, A3C)의 한계를 먼저 알아야 합니다.Actor-Critic / A2C / A3C의..