返回列表 发布新帖

深度强化学习TD3算法在倒立摆系统中的应用

20 0
admin 发表于 2024-12-14 03:09 | 查看全部 阅读模式

文档名:深度强化学习TD3算法在倒立摆系统中的应用
摘要:针对现有控制算法在倒立摆系统控制中存在的局限性,融合强化学习和深度学习方法,提出一种基于双延迟深度确定性策略梯度(TD3)的倒立摆端到端控制方法.首先,利用倒立摆动力学模型搭建虚拟仿真环境,设计稀疏奖励函数;其次,通过深度神经网络构建从倒立摆状态输入到执行动作输出的端到端控制模型,分析倒立摆特性,来确定神经网络结构和参数;最后,将虚拟仿真环境中生成的模型移植到倒立摆实物平台并进行优化.试验结果表明:该方法生成的模型能够有效地建立倒立摆状态和执行动作之间的映射关系,在运动控制中具有一定的借鉴意义.

作者:何卫东   刘小臣   张迎辉   姚世选 Author:HEWeidong   LIUXiaochen   ZHANGYinghui   YAOShixuan
作者单位:大连交通大学机械工程学院,辽宁大连116028大连外国语大学软件学院,辽宁大连116044
刊名:大连交通大学学报 ISTIC
Journal:JournalofDalianJiaotongUniversity
年,卷(期):2023, 44(1)
分类号:
关键词:深度强化学习  倒立摆控制  TD3  端到端  稀疏奖励函数  
机标分类号:TP391TP181TP242
在线出版日期:2023年3月24日
基金项目:深度强化学习TD3算法在倒立摆系统中的应用[
期刊论文]  大连交通大学学报--2023, 44(1)何卫东  刘小臣  张迎辉  姚世选针对现有控制算法在倒立摆系统控制中存在的局限性,融合强化学习和深度学习方法,提出一种基于双延迟深度确定性策略梯度(TD3)的倒立摆端到端控制方法.首先,利用倒立摆动力学模型搭建虚拟仿真环境,设计稀疏奖励函数;其次...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        深度强化学习TD3算法在倒立摆系统中的应用  Research on Application of Deep Reinforcement Learning TD3 Algorithm in Inverted Pendulum System

深度强化学习TD3算法在倒立摆系统中的应用.pdf
2024-12-14 03:09 上传
文件大小:
1.23 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表