首页
教程
IT编程
国外技术
登录
标签
Partially
Deep Recurrent Q-Learning for Partially Observable MDPs(DRQN)
Abstract 深度RL已经为复杂的任务提供了精通的控制器。但是,这些控制器的内存有限,并且依赖于能够在每个决策点感知完整的游戏画面。为了解决这些缺点,本文研究了用循环LS
learning
Recurrent
deep
Partially
DRQN
admin
4月前
32
0