文档名:深度强化学习TD3算法在倒立摆系统中的应用
摘要:针对现有控制算法在倒立摆系统控制中存在的局限性,融合强化学习和深度学习方法,提出一种基于双延迟深度确定性策略梯度(TD3)的倒立摆端到端控制方法.首先,利用倒立摆动力学模型搭建虚拟仿真环境,设计稀疏奖励函数;其次,通过深度神经网络构建从倒立摆状态输入到执行动作输出的端到端控制模型,分析倒立摆特性,来确定神经网络结构和参数;最后,将虚拟仿真环境中生成的模型移植到倒立摆实物平台并进行优化.试验结果表明:该方法生成的模型能够有效地建立倒立摆状态和执行动作之间的映射关系,在运动控制中具有一定的借鉴意义.
作者:何卫东 刘小臣 张迎辉 姚世选 Author:HEWeidong LIUXiaochen ZHANGYinghui YAOShixuan
作者单位:大连交通大学机械工程学院,辽宁大连116028大连外国语大学软件学院,辽宁大连116044
刊名:大连交通大学学报 ISTIC
Journal:JournalofDalianJiaotongUniversity
年,卷(期):2023, 44(1)
分类号:
关键词:深度强化学习 倒立摆控制 TD3 端到端 稀疏奖励函数
机标分类号:TP391TP181TP242
在线出版日期:2023年3月24日
基金项目:深度强化学习TD3算法在倒立摆系统中的应用[
期刊论文] 大连交通大学学报--2023, 44(1)何卫东 刘小臣 张迎辉 姚世选针对现有控制算法在倒立摆系统控制中存在的局限性,融合强化学习和深度学习方法,提出一种基于双延迟深度确定性策略梯度(TD3)的倒立摆端到端控制方法.首先,利用倒立摆动力学模型搭建虚拟仿真环境,设计稀疏奖励函数;其次...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
深度强化学习TD3算法在倒立摆系统中的应用 Research on Application of Deep Reinforcement Learning TD3 Algorithm in Inverted Pendulum System
深度强化学习TD3算法在倒立摆系统中的应用.pdf
- 文件大小:
- 1.23 MB
- 下载次数:
- 60
-
高速下载
|