会议论文《Keepaway抢球任务中基于策略重用的迁移学习算法》提出了一种在Keepaway抢球任务中应用的迁移学习方法。该算法通过策略重用来提高新任务的学习效率,减少训练时间。研究重点在于如何将已有任务中的策略有效迁移至新环境中,以增强智能体的适应能力。该成果为多智能体协作任务中的迁移学习提供了新的思路。
文档为pdf格式,1.68MB,总共5页。
举报