369IT编程
  •  首页
  •  教程
  •  IT编程
  •  国外技术
  •  登录
  1. 标签
  2. Partially
  • Deep Recurrent Q-Learning for Partially Observable MDPs(DRQN)

    Abstract 深度RL已经为复杂的任务提供了精通的控制器。但是,这些控制器的内存有限,并且依赖于能够在每个决策点感知完整的游戏画面。为了解决这些缺点,本文研究了用循环LS
    learningRecurrentdeepPartiallyDRQN
    admin4月前
    320
CopyRight © 2022 All Rights Reserved
Processed: 0.026, SQL: 9