基于约束MORKOV的强化学习的研究与应用 - 2009国际信息技与应用论坛.pdf

4 0
2026-1-11 15:57 | 查看全部 阅读模式

会议论文《基于约束MORKOV的强化学习的研究与应用》发表于2009年国际信息技与应用论坛。该文探讨了在约束条件下的马尔可夫决策过程(CMDP)在强化学习中的应用,旨在提高智能体在复杂环境中的决策能力。研究提出了一种改进的算法,有效平衡了策略优化与约束满足之间的关系,为实际应用提供了理论支持。

文档为pdf格式,0.29MB,总共4页。

基于约束MORKOV的强化学习的研究与应用 - 2009国际信息技与应用论坛
文件大小:
296.96 KB
高速下载
2026 资料下载 联系邮件:1991591830#qq.com 浙ICP备2024084428号-1