• 马尔可夫潜在博弈主要关注多智能体系统中的非合作决策制定,每个智能体都追求最大化其个体长期奖励。在这种情况下,智能体的决策会影响环境的状态转移概率,从而影响其他智能体的奖励。因
    admin5月前
    360