基于深度强化学习的虚拟机器人采摘路径避障规划

熊俊涛; 李中行; 陈淑绵; 郑镇辉

首页> 中文期刊> 《农业机械学报》 >基于深度强化学习的虚拟机器人采摘路径避障规划

基于深度强化学习的虚拟机器人采摘路径避障规划

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对采摘机器人在野外作业环境中,面临采摘任务数量多,目标与障碍物位置具有随机性和不确定性等问题,提出一种基于深度强化学习的虚拟机器人采摘路径避障规划方法,实现机器人在大量且不确定任务情况下的快速轨迹规划。根据机器人本体物理结构设定虚拟机器人随机运动策略,通过对比分析不同网络输入观测值的优劣,结合实际采摘行为设置环境观测集合,作为网络的输入;引入人工势场法目标吸引和障碍排斥的思想建立奖惩函数,对虚拟机器人行为进行评价,提高避障成功率;针对人工势场法范围斥力影响最短路径规划的问题,提出了一种方向惩罚避障函数设置方法,将障碍物范围惩罚转换为单一方向惩罚,通过建立虚拟机器人运动碰撞模型,分析碰撞结果选择性给予方向惩罚,进一步优化了规划路径长度,提高采摘效率;在Unity内搭建仿真环境,使用MLAgents组件建立分布式近端策略优化算法及其与仿真环境的交互通信,对虚拟机器人进行采摘训练。仿真实验结果显示,不同位置障碍物设置情况下虚拟机器人完成采摘任务成功率达96.7%以上。在200次随机采摘实验中,方向惩罚避障函数方法采摘成功率为97.5%,比普通奖励函数方法提高了11个百分点,采摘轨迹规划平均耗时0.64 s/次,相较于基于人工势场法奖励函数方法降低了0.45 s/次,且在连续变动任务实验中具有更高的适应性和鲁棒性。研究结果表明,本系统能够高效引导虚拟机器人在避开障碍物的前提下快速到达随机采摘点,满足采摘任务要求,为真实机器人采摘路径规划提供理论与技术支撑。

著录项

来源
《农业机械学报》 |2020年第s02期|1-10|共10页
作者
熊俊涛; 李中行; 陈淑绵; 郑镇辉;
展开▼
作者单位

华南农业大学数学与信息学院;

广州510642;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机仿真;
关键词
采摘机器人; 路径规划; 避障; 深度强化学习; 人工势场法;

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的工业机器人避障路径规划方法 [J] . 李文彪 . 制造业自动化 . 2022,第1期
2. 基于深度强化学习的机械臂避障路径规划研究 [J] . 李广创 ,程良伦 . 软件工程师 . 2019,第003期
3. 基于深度强化学习的机械臂避障路径规划研究 [J] . 李广创1 ,程良伦1 . 软件工程 . 2019,第003期
4. 基于改进PRM的采摘机器人机械臂避障路径规划 [J] . 邹宇星 ,李立君 ,高自成 . 传感器与微系统 . 2019,第001期
5. 基于深度强化学习的智能机器人避障决策模型 [J] . 凌涛 . 新乡学院学报（自然科学版） . 2021,第003期
6. 基于改进势场法的移动机器人避障路径规划 [C] . 刘春阳 ,程亿强 ,柳长安 . 2009年中国智能自动化会议 . 2009
7. 基于C--空间的桐油果采摘机器人机械臂避障路径规划研究 [A] . 李帅 . 2015

基于深度强化学习的虚拟机器人采摘路径避障规划

摘要

著录项

相似文献

相关主题

期刊订阅