会议论文《多Agent系统连续时间Option算法》发表于第29届中国控制会议,探讨了在连续时间环境下多智能体系统的协同决策问题。该文提出一种基于Option理论的算法,旨在提升多Agent系统在动态环境中的学习效率与策略稳定性。通过引入分层强化学习框架,有效解决了复杂任务分解与协作控制难题,为智能控制系统提供了新的研究思路。
文档为pdf格式,0.52MB,总共6页。
举报