Department of Computer Science and Engineering Sogang University Seoul Korea;
Program of Integrated Biotechnology at Sogang University. hschang@sogang.ac.kr;
机译:使用经验丰富的交互式部分可观察的马尔可夫决策过程对人类递归推理建模
机译:马尔可夫决策过程的递归学习自动机方法
机译:随机预测控制对部分观察到的马尔可夫决策过程,时间关节机会限制和应用于自主车辆控制
机译:用于控制部分观察到的马尔可夫决策过程的递归学习自动机
机译:使用抽象动作学习部分可观察的马尔可夫决策过程。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:受控部分可观察的马尔可夫决策过程的随机优化
机译:连续状态部分可观测马尔可夫决策过程中模糊强化学习agent的协作与协调