返回列表 发布新帖

基于深度强化学习的双置换表优化算法研究

22 0
admin 发表于 2024-12-14 12:02 | 查看全部 阅读模式

文档名:基于深度强化学习的双置换表优化算法研究
摘要:基于深度强化学习的计算机博弈程序(如AlphaGo)已在围棋上战胜了人类世界冠军.这些算法利用可学习的价值神经网络和策略神经网络指导蒙特卡洛树的探索.为提高蒙特卡洛树的搜索性能,已提出多种改进方法,其中置换表已被证明可提高搜索效率.在此基础上,提出一种新的基于置换表的方法——基于深度强化学习的双置换表优化算法.该方法使用不同的替换策略管理双层置换表,并将六子棋的两步落子解耦为2个独立的神经网络.这不仅减小了动作空间规模,也更易于神经网络训练.以六子棋为例进行的实验结果表明,在有限的计算资源下,该方法能显著提升棋局哈希命中率和程序棋力水平.

Abstract:Computergameprogramsbasedondeepreinforcementlearning,suchasAlphaGo,havebeatenhumanworldchampionsinthegameofGo.ThesealgorithmsutilizelearnablevalueneuralnetworksandpolicyneuralnetworkstoguidetheexplorationprocessofMonteCarloTreeSearch.VariousenhancementmethodshavebeenproposedtoimprovethesearchperformanceofMonteCarlotrees,amongwhichthetranspositiontablehasbeenproventoenhancesearchefficiency.Buildinguponthisfoundation,thispaperintroducesanovelmethod,thetwo-leveltranspositiontableoptimizationalgorithmbasedondeepreinforcementlearning.Thismethodmanagestwoleveltranspositiontablesusingdistinctreplacementstrategiesanddecouplesthetwo-stepmovesofConnect6intotwoindependentneuralnetworks.Thisnotonlyreducesthescaleoftheactionspacebutalsosimplifiesneuralnetworktraining.OurexperimentalresultsusingConnect6asanexampledemonstratethisapproachsignificantlyenhancestheprogram'splayingstrengthunderlimitedcomputationalresources.

作者:王栋年   王军伟   薛世超   汪超   徐长明 Author:WANGDongnian   WANGJunwei   XUEShichao   WANGChao   XUChangming
作者单位:东北大学研究生院,河北秦皇岛066004东北大学秦皇岛分校计算机与通信工程学院,河北秦皇岛066004
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(9)
分类号:TP18
关键词:深度强化学习  置换表  计算机博弈  AlphaGo  蒙特卡洛树  
Keywords:deepreinforcementlearning  transpositiontable  computergame  AlphaGo  MCTS  
机标分类号:TP391.9TP18G891.2
在线出版日期:2024年7月11日
基金项目:河北省自然科学基金面上项目基于深度强化学习的双置换表优化算法研究[
期刊论文]  重庆理工大学学报--2024, 38(9)王栋年  王军伟  薛世超  汪超  徐长明基于深度强化学习的计算机博弈程序(如AlphaGo)已在围棋上战胜了人类世界冠军.这些算法利用可学习的价值神经网络和策略神经网络指导蒙特卡洛树的探索.为提高蒙特卡洛树的搜索性能,已提出多种改进方法,其中置换表已被证...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        基于深度强化学习的双置换表优化算法研究  Two-level transposition table optimization algorithm based on deep reinforcement learning

基于深度强化学习的双置换表优化算法研究.pdf
2024-12-14 12:02 上传
文件大小:
4.97 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表