深度强化学习在避障轨迹规划中的应用【matlab电气工程】

一、主要内容

前基于深度强化学习的避障方法,通常是引入额外的奖励函数,例如当机械臂发生碰撞时给予一个惩罚。然而,设置的奖惩系统往往需要进行平衡性修正,平衡策略探索与避障之间的矛盾,还要考虑稀疏性和局部最优等问题。而且获取实物机械臂与障碍物的实时且精准的信息也是一个难点。此外,当面对凹多面体障碍物时,用于避障的惩罚项可能会制造出一个虚拟的三维惩罚屏障来阻碍机械臂的动作探索。

为了克服专家策略获取难度大的问题,本文研究提出一种基于生成对抗模仿学习的专家记忆库扩增机制。该机制的目的是通过少量的人工示教数据,扩增得到大量的专家经验数据,在一定程度上降低大量专家经验数据的获取难度。此外,研究分析专家经验数据对深度强化学习的策略优化能力的影响。设计一种预言家策略网络引导的深度强化学习算法。该算法具有专家策略自优化能力,能够避免出现专家策略本身就是局部最优策略的情况,而且能够对变化的场景有较好的泛用性。此外,研究分析专家策略对不同任务场景的引导效果。针对专家经验数据利用效率低的问题,本文研究提出一种结合了专家记忆库扩增机制的无偏双记忆库采样机制。此外,研究该机制在算法训练前期的引导效果,以及算法收敛后的影响。

二、核心代码与过程

深度强化学习在避障轨迹规划中的应用【matlab电气工程】_第1张图片

深度强化学习在避障轨迹规划中的应用【matlab电气工程】_第2张图片

专家记忆库

深度强化学习在避障轨迹规划中的应用【matlab电气工程】_第3张图片

机械臂仿真

深度强化学习在避障轨迹规划中的应用【matlab电气工程】_第4张图片

械臂受到外力干扰时外部力矩仿真

深度强化学习在避障轨迹规划中的应用【matlab电气工程】_第5张图片

算法收敛情况

深度强化学习在避障轨迹规划中的应用【matlab电气工程】_第6张图片

算法仿真对比

三、更多参考内容

多自由度类人机器人设计及双冗余度机械臂运动规划
机床辅助机器人避障路径规划研究
基于机器视觉的工业机器人装配系统开发
巡检机器人全方位获取柑橘果实表面信息方法研究与试验
基于ROS的机械臂避障运动规划及仿真
基于改进蚁群算法的六自由度机械臂避障路径规划
六自由度机械臂的避障路径及轨迹规划研究
机器人规划与智能控制的研究及其仿真
基于六自由度机械臂的避障路径规划研究 
番茄串的机器人采收方法研究与应用
基于3D视觉的目标定位和机器人运动轨迹规划方法研究
六自由度机械臂避障运动规划与抓取位置检测研究
基于双目视觉的未知环境下机械臂避障研究
基于视觉的工业机械臂智能避障与协同作业研究
面向抓取作业的机械臂避障路径规划算法研究
冗余自由度机械臂模块化关节设计及其运动规划方法研究
水下机械臂轨迹规划及控制系统研究与实现
基于高斯混合模型的机械臂运动规划和路径优化研究
单孔腹腔镜手术机器人从手末端夹持机械臂研究 
大型复杂零部件激光熔覆机械臂路径规划研究
基于ROS的轮式移动机械臂轨迹规划研究
移动机械臂目标抓取轨迹规划与控制系统设计
高压室巡检机器人柔顺控制方法研究
焊接机器人工作站三维空间多障碍物避障与路径规划算法研究
基于距离标识栅格的机器人避障运动规划研究
机器人双目视觉示教方法及避障轨迹规划研究
冗余机械臂动态避障规划
多自由度机械臂避障路径规划算法研究
基于关节空间的采摘机器人机械臂实时避障算法研究 
视觉引导的空间机械臂避障路径规划方法研究
高速公路绿篱修剪机器人运动特性研究
六自由度模块化机械臂路径规划仿真系统研究与实现
护士助手机器人系统设计
仿人机械臂的运动规划与优化算法研究
机械臂运动的示教学习方法与应用研究
基于触觉的协作机器人安全技术研究
一种冗余双臂机器人控制系统设计及其控制方法研究
基于Baxter机器人的避障路径规划关键技术研究
六自由度重载工业机器人控制方法研究 
工业机械臂在复杂环境下避障路径规划
面向狭窄通道的机械臂避障规划与示教技术研究及应用
移动无人生物安全实验室机械臂运动规划和在线避障研究
基于机器视觉的工业机器人装配系统开发
冗余自由度机器人的路径规划研究
基于多传感器的空间机械臂精细操作控制方法研究
基于视觉伺服的移动机械臂抓取研究
面向人机协作的轻型柔顺机械臂结构设计与控制研究
线驱动柔性机械臂运动控制系统的设计研究
面向机器人智能皮肤的柔性触觉传感器研究 
冗余空间机械臂的运动规划方法研究
基于Kinect辅助的服务机器人抓取路径规划研究
配电线路维护机器人运动规划与实验研究
猕猴手臂避障规划与执行过程中背侧运动前区皮层的表征与解码
六自由度机械臂可通过性的研究与判定
冗余双臂机器人协调作业系统研究
多约束下的机械臂运动控制算法研究
基于视觉的铝电解槽机器人自主抓取作业的关键技术研究
冗余度双臂工业机器人虚拟样机的研究
心理旋转和空间定向对机械臂遥操作绩效的影响 
一种充气式软体全向弯曲模块关键技术研究
冗余双臂机器人在线运动规划与协调操作方法研究
茄子采摘机器人目标识别及避障路径规划研究
冗余机械臂运动避障与路径规划
冗余机械臂运动学及避障路径规划研究
重载冗余机械臂运动学力学分析及路径规划
六自由度机械臂可通过性的研究与判定
排爆车及其附属机器人手臂路径规划研究
接触交互式避障机器人的建模与仿真研究
全方位移动机械臂协调规划与控制 
月壤表层采样机械臂及末端执行器运动规划与位姿检测
月壤表层采样机械臂及末端执行器运动规划与位姿检测
面向脊柱微创手术机器人的运动规划与控制研究
双臂液控机器人控制系统仿真
微创手术机器人远心定位机构设计与优化
基于深度视觉的服务机器人感知技术与应用研究
隧道清洗车工作装置的结构分析与避障研究
七自由度空间机械臂路径规划的避障研究
苹果采摘机器人机械手避障关键技术研究
在轨服务空间机械臂运动及任务规划方法研究 
番茄串的机器人采收方法研究与应用
基于3D视觉的目标定位和机器人运动轨迹规划方法研究
六自由度机械臂避障运动规划与抓取位置检测研究
基于双目视觉的未知环境下机械臂避障研究
基于视觉的工业机械臂智能避障与协同作业研究
面向抓取作业的机械臂避障路径规划算法研究
冗余自由度机械臂模块化关节设计及其运动规划方法研究
水下机械臂轨迹规划及控制系统研究与实现
 

博主简介:本人擅长数据处理、建模仿真、程序设计、论文写作与指导,毕业论文、期刊论文经验交流。个人博客:kelaboshi.com。

你可能感兴趣的:(matlab,开发语言)