admin 发表于 2024-12-14 13:39

改进DDPG算法在外骨骼机械臂轨迹运动中的应用


文档名:改进DDPG算法在外骨骼机械臂轨迹运动中的应用
摘要:针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了原始采样的策略.此外,相较于以往二值奖励函数,本文根据物理模型提出针对化的分区奖励.在OpenAIGym平台上实现仿真环境,实验结果表明:改进的算法收敛速度提升了约9.2%,学习过程更加稳定.

作者:苏杰   刘光宇   暨仲明   黄雨梦 Author:SUJie   LIUGuangyu   JIZhongming   HUANGYumeng
作者单位:杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018;杭州电子科技大学浙江省物联感知与信息融合重点实验室,浙江杭州310018杭州电子科技大学自动化学院(人工智能学院),浙江杭州310018
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(2)
分类号:TP391
关键词:外骨骼机械臂深度强化学习优先经验回放与分区奖励深度确定性策略梯度
机标分类号:TP241TP301.6TP18
在线出版日期:2023年3月13日
基金项目:国家自然科学基金,国家自然科学基金,浙江省自然科学研究基金资助项目改进DDPG算法在外骨骼机械臂轨迹运动中的应用[
期刊论文]传感器与微系统--2023, 42(2)苏杰刘光宇暨仲明黄雨梦针对现阶段外骨骼机器人轨迹运动时出现效果不佳的问题,提出了基于优先经验回放与分区奖励(PERDA)融合的深度确定性策略梯度(DDPG)强化学习算法,即PERDA-DDPG.该方法利用时间差分误差(TD-errors)的大小对经验排序,改变了...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        改进DDPG算法在外骨骼机械臂轨迹运动中的应用Application of improved DDPG algorithm in trajectory motion of exoskeleton manipulator

改进DDPG算法在外骨骼机械臂轨迹运动中的应用.pdf
页: [1]
查看完整版本: 改进DDPG算法在外骨骼机械臂轨迹运动中的应用