強化学習を用いた変動環境下の最短経路探索

甲斐孝史; 石川眞澄

首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >強化学習を用いた変動環境下の最短経路探索

【24h】

強化学習を用いた変動環境下の最短経路探索

机译：強化学習を用いた変動環境下の最短経路探索

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相关主题

摘要

エージェント自身に環境認識を行わせ、環境変化を認識するとMapの再学習を行わせることで変動環境下においてゴールまでの最適行動を強化学習によって求めることを目的とする。また、最短行動を学習済みでも時節環境の探索を行わせることにより新しい最短経路の出現にも対応する。環境の認識は尤度を求めることにより行う。シミュレーション実験を行い、パラメータの設定の調整により行動回数を減少することが出来た。併せて、提案手法で用いたパラメータ値がエージェントの行動に与える影響についても検討した。

著录项

来源
《電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing》 |2009年第461期|119-124|共6页
作者
甲斐孝史; 石川眞澄;
展开▼
作者单位

九州工業大学大学院生命体工学研究科;

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类人工智能理论;
关键词
強化学習; グリッドベース地図; 好奇心; 内部報酬; 変動環境;

強化学習を用いた変動環境下の最短経路探索

摘要

著录项

相关主题

期刊订阅