admin 发表于 2024-12-14 11:45

基于改进强化学习的机器人双足步态控制方法


文档名:基于改进强化学习的机器人双足步态控制方法
摘要:为提高双足机器人应对不同场地步态控制的自主性与稳定性,提出了一种基于改进强化学习的机器人双足步态控制方法.在构建机器人双足步态控制强化学习框架的基础上,对确定性策略梯度进行修正,基于Actor-Critic结构将网络训练样本一分为二,分别对行为价值进行独立估计,通过使用多层神经网络参数化策略并应用确定性策略梯度学习,从而学习到具有较强鲁棒性的步态控制策略.仿真实验表明:通过本文方法能够使机器人臀部、大腿、关节、小腿以及指向获得更为稳定的控制策略,步态收敛更迅速、步态收敛域更大,实现了不同速度下不同场地的稳健步行运动.

作者:罗印徐文平Author:LUOYinXUWenping
作者单位:四川托普信息技术职业学院,四川成都611743
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(9)
分类号:TP242.6
关键词:双足机器人步态控制强化学习确定性策略梯度Actor-Critic网络
Keywords:bipedrobotgaitcontrolreinforcementlearningdeterministicstrategygradientActor-Criticnetwork
机标分类号:TP181TP273V249.1
在线出版日期:2023年9月26日
基金项目:国家自然科学基金基于改进强化学习的机器人双足步态控制方法[
期刊论文]传感器与微系统--2023, 42(9)罗印徐文平为提高双足机器人应对不同场地步态控制的自主性与稳定性,提出了一种基于改进强化学习的机器人双足步态控制方法.在构建机器人双足步态控制强化学习框架的基础上,对确定性策略梯度进行修正,基于Actor-Critic结构将网络训...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于改进强化学习的机器人双足步态控制方法Robot bipedal gait control method based on improved reinforcement learning

基于改进强化学习的机器人双足步态控制方法.pdf
页: [1]
查看完整版本: 基于改进强化学习的机器人双足步态控制方法