机译:固定时间空间差异游戏申请普里雷普雷斯模糊演员 - 评论家算法
Beihang Univ Sch Astronaut 37 Xueyuan Rd Beijing 100191 Peoples R China;
Beihang Univ Sch Astronaut 37 Xueyuan Rd Beijing 100191 Peoples R China;
Carleton Univ Dept Syst & Comp Engn Ottawa ON Canada;
Beihang Univ Sch Astronaut 37 Xueyuan Rd Beijing 100191 Peoples R China;
Differential game; reinforcement learning; actor-critic; fuzzy system;
机译:基于队列的随机博弈中多主体学习的actor-Critic算法
机译:具有高级避让者的追逃性微分游戏的分散模糊学习算法
机译:将游戏机制和学生生成的问题应用于基于在线拼图的游戏学习系统,以提高算法思维能力
机译:追逃微分游戏的模糊行为者学习自动机算法
机译:使用强化模糊学习在追逃性差分游戏中学习。
机译:在太空一对一游戏中追踪卫星的预训练模糊强化学习方法
机译:N-player中学习纳什均衡的演员批评算法 一般和游戏