文档名:一种基于DDPG算法的6轴机械臂控制研究
摘要:针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deepdeterministicpolicygradient,DDPG)的控制算法,以更好地解决6轴机械臂在三维空间中的控制难题.在MuJoCo平台上建立仿真环境,引入所设计机械臂为测试对象,并采用DDPG算法、柔性动作-评估算法(softactor-criticalgorithms,SAC)和双延迟深度确定策略梯度算法(twindelayeddeepdeterministicpolicygradient,TD3)对仿真环境下的机械臂进行了几组对比测试.研究表明:以DDPG算法为基础的机械臂控制方法能够有效地提高机械臂的控制精度,相对于SAC、TD3等算法稳定性较好.
作者:何联格 李天华 聂远航 妥吉英 Author:HELiange LITianhua NIEYuanhang TUOJiying
作者单位:重庆理工大学汽车零部件先进制造技术教育部重点实验室,重庆400054;北京信息科技大学现代测控技术教育部重点实验室,北京100192;重庆青山工业有限责任公司,重庆402761重庆理工大学汽车零部件先进制造技术教育部重点实验室,重庆400054重庆理工大学汽车零部件先进制造技术教育部重点实验室,重庆400054;重庆青山工业有限责任公司,重庆402761
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2023, 37(17)
分类号:TP241
关键词:6自由度 机械臂 控制 强化学习 DDPG
Keywords:sixdegreesoffreedom roboticarm control reinforcementlearning DDPG
机标分类号:TP181TP393V249.1
在线出版日期:2023年10月25日
基金项目:重庆市基础科学与前沿技术研究专项课题,重庆市教育委员会科学技术研究计划青年项目一种基于DDPG算法的6轴机械臂控制研究[
期刊论文] 重庆理工大学学报--2023, 37(17)何联格 李天华 聂远航 妥吉英针对传统控制算法在复杂环境下,精度低、稳定性不足等问题,提出了一种基于深度确定策略梯度算法(deepdeterministicpolicygradient,DDPG)的控制算法,以更好地解决6轴机械臂在三维空间中的控制难题.在MuJoCo平台上建...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
一种基于DDPG算法的6轴机械臂控制研究 Research on the control of a six-axis robotic arm using the DDPG algorithm
一种基于DDPG算法的6轴机械臂控制研究.pdf
- 文件大小:
- 2.72 MB
- 下载次数:
- 60
-
高速下载
|