文档名:基于改进强化学习的机器人双足步态控制方法
摘要:为提高双足机器人应对不同场地步态控制的自主性与稳定性,提出了一种基于改进强化学习的机器人双足步态控制方法.在构建机器人双足步态控制强化学习框架的基础上,对确定性策略梯度进行修正,基于Actor-Critic结构将网络训练样本一分为二,分别对行为价值进行独立估计,通过使用多层神经网络参数化策略并应用确定性策略梯度学习,从而学习到具有较强鲁棒性的步态控制策略.仿真实验表明:通过本文方法能够使机器人臀部、大腿、关节、小腿以及指向获得更为稳定的控制策略,步态收敛更迅速、步态收敛域更大,实现了不同速度下不同场地的稳健步行运动.
作者:罗印 徐文平Author:LUOYin XUWenping
作者单位:四川托普信息技术职业学院,四川成都611743
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(9)
分类号:TP242.6
关键词:双足机器人 步态控制 强化学习 确定性策略梯度 Actor-Critic网络
Keywords:bipedrobot gaitcontrol reinforcementlearning deterministicstrategygradient Actor-Criticnetwork
机标分类号:TP181TP273V249.1
在线出版日期:2023年9月26日
基金项目:国家自然科学基金基于改进强化学习的机器人双足步态控制方法[
期刊论文] 传感器与微系统--2023, 42(9)罗印 徐文平为提高双足机器人应对不同场地步态控制的自主性与稳定性,提出了一种基于改进强化学习的机器人双足步态控制方法.在构建机器人双足步态控制强化学习框架的基础上,对确定性策略梯度进行修正,基于Actor-Critic结构将网络训...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于改进强化学习的机器人双足步态控制方法 Robot bipedal gait control method based on improved reinforcement learning
基于改进强化学习的机器人双足步态控制方法.pdf
- 文件大小:
- 1.68 MB
- 下载次数:
- 60
-
高速下载
|
|