论文《基于AMDP-Q的自主车辆行驶策略求解》提出了一种结合AMDP与Q学习的方法,用于解决自主车辆在复杂环境中的行驶策略问题。该方法通过引入状态空间划分和多目标优化,提升了传统Q学习的效率和适应性。实验结果表明,该方法在动态交通环境中能够有效提高决策的准确性和实时性,为智能驾驶技术提供了新的思路。
举报