退出
我的积分:
中文文献批量获取
外文文献批量获取
王学宁; 贺汉根; 徐昕;
国防科技大学自动化研究所;
强化学习; 部分可观测Markov决策过程; Sarsa学习; 无记忆策略;
机译:部分可观察的马尔可夫决策过程的脉冲神经网络强化学习算法
机译:在线并发强化学习算法,用于求解部分未知的非线性连续时间系统的两人零和游戏
机译:有限视野,部分观测的马尔可夫决策过程的混合遗传/优化算法
机译:马氏随机场中抽样设计的强化学习算法
机译:半马尔可夫决策过程的固定探索新强化学习算法
机译:Acuros CTS:一种快速的线性Boltzmann输运方程式求解器用于计算机断层扫描散射–第一部分:核心算法和验证
机译:连续状态部分可观测马尔可夫决策过程中模糊强化学习agent的协作与协调
机译:马氏决策过程中转移概率值的混合估计
机译:马氏决策过程中过渡概率值的插值
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。