【24h】

強化学習を用いた変動環境下の最短経路探索

机译:強化学習を用いた変動環境下の最短経路探索

获取原文
获取原文并翻译 | 示例
           

摘要

エージェント自身に環境認識を行わせ、環境変化を認識するとMapの再学習を行わせることで変動環境下においてゴールまでの最適行動を強化学習によって求めることを目的とする。また、最短行動を学習済みでも時節環境の探索を行わせることにより新しい最短経路の出現にも対応する。環境の認識は尤度を求めることにより行う。シミュレーション実験を行い、パラメータの設定の調整により行動回数を減少することが出来た。併せて、提案手法で用いたパラメータ値がエージェントの行動に与える影響についても検討した。

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号