首页> 外文期刊>International Journal of Adaptive Control and Signal Processing >Heuristic dynamic programming using echo state network as online trainable adaptive critic
【24h】

Heuristic dynamic programming using echo state network as online trainable adaptive critic

机译:使用回声状态网络作为在线可训练自适应评论家的启发式动态规划

获取原文
获取原文并翻译 | 示例
           

摘要

The present paper proposes an implementation of a relatively new recurrent neural network architecture-the echo state network (ESN)-within the frame of heuristic dynamic programming. The ESN is trained online to estimate the utility function and to adapt the control policy of an embodied agent. With the advantage of an easy training algorithm, the ESN architecture offers a simple way to calculate the derivatives required for adapting the controller. Experimental results are provided to validate the proposed learning approach.
机译:本文提出了一种相对新的递归神经网络体系结构-回声状态网络(ESN)-在启发式动态规划框架内的实现。对ESN进行在线培训,以评估实用功能并调整具体代理的控制策略。利用简单的训练算法,ESN体系结构提供了一种简单的方法来计算适应控制器所需的导数。提供实验结果以验证所提出的学习方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号