Pytorch에서의 구현.
소개
지난 몇 개의 기사를 통해 우리는 논의 그리고 구현 딥 Q-러닝 (DQN) 및 더블 딥 Q 학습 (DDQN) VizDoom 게임 환경 그리고 그들의 성과를 평가했다. Deep Q-learning은 보상을 최대화하기 위해 환경에서 상태-행동(Q) 값의 추정에 대한 빠른 에피소드 내 업데이트를 활용하는 매우 유연하고 반응이 빠른 온라인 학습 접근 방식입니다. Double Deep Q-Learning은 Q-value 과대평가를 최소화하기 위해 action selection과 TD-target 계산을 담당하는 네트워크를 분리함으로써 이를 기반으로 합니다. 가능한 대부분의 상태.
#둠 #딥러닝 #ai #openai #강화학습

방향데이터사이언스닷컴
Dueling Deep Q-learning을 사용하여 Doom용 공격형 AI 에이전트 구축
VizDoom 게임 환경에서 Deep Q-learning(DQN) 및 Double Deep Q Learning(DDQN)에 대해 논의 및 구현하고 성능을 평가했습니다.