机译:基于经验矩的多臂强盗算法
Graduate School of Frontier Sciences, The University of Tokyo Kashiwanoha 5-1-5, Kashiwa-shi, Chiba, 277-8561, Japan;
Graduate School of Information Science and Technology, The University of Tokyo Hongo 7-3-1, Bunkyo-ku, Tokyo, 113-8656, Japan;
multiarmed bandit problem; tchebycheff system; moment space; divergence minimization;
机译:基于经验矩的多臂强盗算法
机译:基于经验矩的多臂强盗算法
机译:基于经验矩的多臂强盗算法
机译:合作多臂匪的社会模仿:具有严格本地信息的基于分区的算法
机译:PDE接近两个在线学习问题,以及对一些基于神经网络的主题学习算法的实证研究
机译:多用户多通道认知无线电网络中基于信任和多臂强盗的信道选择
机译:多臂匪盗分布式协同决策: Frequentist和贝叶斯算法