文档名:基于DRL和轨迹优化的多机器人导航和编队维护
摘要:本文提出了一种基于深度强化学习(DRL)和轨迹优化的方法来实现避障导航同时保持编队.定义了基于图论的可微队形度量,并将其与DRL相结合,提出了一种新的近端策略优化联合轨迹优化(PPO-TO)的算法.多个机器人共享策略,通过由DRL得到的马尔可夫决策模型生成预测轨迹,并通过编队度量进行优化,最终由机器人对该轨迹进行跟踪.在生成的随机地图上进行了大量的测试实验,结果表明:所提方法可以实现多机器人的编队和导航的任务,并且相对端到端的PPO算法有着明显的性能提升.
作者:朱继伟 张隆源 王冀 罗佳宁 李伟Author:ZHUJiwei ZHANGLongyuan WANGJi LUOJianing LIWei
作者单位:复旦大学工程与应用技术研究院,上海200433
刊名:传感器与微系统 ISTICPKU
Journal:TransducerandMicrosystemTechnologies
年,卷(期):2023, 42(9)
分类号:TP242.6
关键词:多机器人导航 编队控制 深度强化学习 轨迹优化
Keywords:multi-robotnavigation formationcontrol deepreinforcementlearning(DRL) trajectoryoptimization
机标分类号:TP242TP391.41TP181
在线出版日期:2023年9月26日
基金项目:上海市科学技术委员会重大专项资助项目,教育部高等教育科学研究中心资助项目基于DRL和轨迹优化的多机器人导航和编队维护[
期刊论文] 传感器与微系统--2023, 42(9)朱继伟 张隆源 王冀 罗佳宁 李伟本文提出了一种基于深度强化学习(DRL)和轨迹优化的方法来实现避障导航同时保持编队.定义了基于图论的可微队形度量,并将其与DRL相结合,提出了一种新的近端策略优化联合轨迹优化(PPO-TO)的算法.多个机器人共享策略,通过...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于DRL和轨迹优化的多机器人导航和编队维护 Multi-robot navigation and formation maintenance based on DRL and trajectory optimization
基于DRL和轨迹优化的多机器人导航和编队维护.pdf
- 文件大小:
- 542.88 KB
- 下载次数:
- 60
-
高速下载
|
|