...
机译:基于在线变分贝叶斯方法的部分可观测环境识别及其在强化学习中的应用
State space model; Variational Bayes method; On-line system identification; Partially observable Markov decision process; Reinforcement learning;
机译:基于在线变分贝叶斯方法的部分可观测环境识别及其在强化学习中的应用
机译:基于学习的强化推论的部分可观察环境估算
机译:在部分可观察的环境中基于梯度的强化学习方法进行动态定价
机译:在线变分贝叶斯方法的系统辨识及其在强化学习中的应用
机译:变形贝叶斯深神经网络:理论,方法和应用
机译:通过有限的强化进行强化学习:使用Bayes风险在POMDP中进行主动学习
机译:部分可观测强化学习的贝叶斯非参数方法