首页> 外文会议>システム·情報部門学術講演会 >ファジィ制御ルールにより表現された方策を持つ方策勾配法:自動車の速度制御における重心モデルを用いたルール重みの学習
【24h】

ファジィ制御ルールにより表現された方策を持つ方策勾配法:自動車の速度制御における重心モデルを用いたルール重みの学習

机译:模糊控制规则表达的措施方法:使用Greefry模型在汽车速度控制中学习规则重量

获取原文

摘要

ファジィ推論と強化学習の典型的な融合方式は,マルコフ決定過程を仮定したQ学習のような価値ベースの強化学習法を用いるものである.一方,これまでに我々は,価値ベースではなく方策を直接学習する強化学習法である方策勾配法とファジィ推論との融合方式を提案してきた.本研究では,その融合方式において,出力値の選択確率を重みとする期待値操作(重心モデルを用いた非ファジィ化)による出力値の決定方式に基づく学習則を提案する.実験の結果,自動車の速度制御シミュレーションにおいてルール重みを適切に学習できたことを示す.
机译:假设马尔可夫确定过程,使用基于价值的增强学习方法,如Q学习,使用基于值的增强学习方法。同时,我们提出了一种融合方案,即一种强化学习方法,直接学习措施,而不是基于价值和融合方法。在本研究中,在融合方法中,我们基于预期值操作的基于输出值的确定方法提出了学习规则(使用中心地BEP中心模型的非模糊模型)重量输出值选择概率。作为实验的结果,它表明可以在汽车的速度控制模拟中正确地学习规则重量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号