首页> 外文期刊>電子情報通信学会技術研究報告 >経路積分強化学習による猫ひねり運動の制御
【24h】

経路積分強化学習による猫ひねり運動の制御

机译:通过路径积分补强学习控制猫扭转运动

获取原文
获取原文并翻译 | 示例
           

摘要

猫ひねり運動は,落下中のネコが外力なしに行う姿勢制御運動であり,その制御法は,宇宙ロボットの制御にも応用可能なものとして実用性を有する.しかし,ネコの姿勢制御システムは非ホロノミックシステムに分類されるものであり,一般的な状態フィードバック則での制御が困難であることが知られている.本研究では,状態には依存せずに時間のみに依存するものとして表現した方策を,経路積分強化学習法によって学習するアプローチを提案する.提案する手法により,ネコの姿勢制御を模したシステムにおける目標状態を達成する制御則を効率よく獲得できることを示す.%The falling-cat motion is a motion for controlling the cat's posture under no existence of external force. To obtain a controller that emits such a motion is of practice, because of its applicability to controlling problems of various systems including space robots. It is not an easy task, however, because the cat's posture control is a nonholonomic system to which general state feedback control is hard to be applied. In this study, we propose an approach to use path integral reinforcement learning for identifying a control policy that is dependent on time but independent of system state. We will show that the proposed method can acquire such a control policy that achieves a goal state (a goal posture) of a dynamical system which models the cat's posture control, in an efficient manner.
机译:猫扭转运动是跌倒的猫在没有外力的情况下进行的姿势控制运动,其控制方法具有实用性,因为它可以应用于太空机器人的控制。它被归类为完整系统,并且已知难以通过一般状态反馈定律进行控制。我们提出了一种使用路径积分强化学习方法来学习策略的方法,表明该方法可以有效地获得在模拟猫的姿势控制的系统中达到目标状态的控制律。运动是一种在没有外力的情况下控制猫的姿势的运动。要获得发出这种运动的控制器是很实际的,因为它适用于控制包括太空机器人在内的各种系统的问题,这并非易事,但是,由于猫的姿势控制是非完整系统,因此难以应用一般状态反馈控制。在本研究中,我们提出了一种使用路径积分强化学习来识别依赖于时间但不依赖于时间的控制策略的方法。我们将证明,所提出的方法可以获取实现动态系统的目标状态(目标姿态)的控制策略。 ich有效地模拟了猫的姿势控制。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号