一种基于DDPG算法的6轴机械臂控制研究

admin · 发表于 2024-12-14 02:52

文档名：一种基于DDPG算法的6轴机械臂控制研究
摘要：针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deepdeterministicpolicygradient,DDPG)的控制算法,以更好地解决6轴机械臂在三维空间中的控制难题.在MuJoCo平台上建立仿真环境,引入所设计机械臂为测试对象,并采用DDPG算法、柔性动作-评估算法(softactor-criticalgorithms,SAC)和双延迟深度确定策略梯度算法(twindelayeddeepdeterministicpolicygradient,TD3)对仿真环境下的机械臂进行了几组对比测试.研究表明:以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度,相对于SAC、TD3等算法稳定性较好.

作者：何联格李天华聂远航妥吉英 Author：HELiange LITianhua NIEYuanhang TUOJiying
作者单位：重庆理工大学汽车零部件先进制造技术教育部重点实验室,重庆400054;北京信息科技大学现代测控技术教育部重点实验室,北京100192;重庆青山工业有限责任公司,重庆402761重庆理工大学汽车零部件先进制造技术教育部重点实验室,重庆400054重庆理工大学汽车零部件先进制造技术教育部重点实验室,重庆400054;重庆青山工业有限责任公司,重庆402761
刊名：重庆理工大学学报 PKU
Journal：JournalofChongqingInstituteofTechnology
年，卷(期)：2023, 37(17)
分类号：TP241
关键词：6自由度  机械臂  控制  强化学习  DDPG
Keywords：sixdegreesoffreedom  roboticarm  control  reinforcementlearning  DDPG
机标分类号：TP181TP393V249.1
在线出版日期：2023年10月25日
基金项目：重庆市基础科学与前沿技术研究专项课题，重庆市教育委员会科学技术研究计划青年项目一种基于DDPG算法的6轴机械臂控制研究[
期刊论文]  重庆理工大学学报--2023, 37(17)何联格  李天华  聂远航  妥吉英针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deepdeterministicpolicygradient,DDPG)的控制算法,以更好地解决6轴机械臂在三维空间中的控制难题.在MuJoCo平台上建...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

一种基于DDPG算法的6轴机械臂控制研究  Research on the control of a six-axis robotic arm using the DDPG algorithm

一种基于DDPG算法的6轴机械臂控制研究.pdf

2024-12-14 02:52 上传

一种基于DDPG算法的6轴机械臂控制研究.pdf

文件大小:: 2.72 MB

下载次数:: 60

高速下载

一种基于DDPG算法的6轴机械臂控制研究

能源电力

化工

建筑工程

机械

电子信息

医药

科学