文档名:维护全局博弈图的蒙特卡洛图搜索
摘要:AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展.而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平.在此基础上,提出了一种新的基于蒙特卡洛图搜索的方法——维护全局博弈图的蒙特卡洛图搜索算法.该方法通过维护一个全局的博弈图,采用过期结点删除算法清除无价值的结点和边,并利用对手的时间进行推理计算等措施,提高了程序的博弈水平.以海克斯棋为实验对象,结果证明,在计算资源受限情况下相比其他搜索算法胜率有所提升.
Abstract:TheAlphaGoseriesalgorithmshavesignificantlyadvancedartificialintelligenceinboardgamesbyemployingneuralnetworkswithlearningvalueandpolicynetworkstoguidetheMonteCarloTreeSearchmethod.RecentresearchresultsindicatereplacingMonteCarloTreeSearchwithMonteCarloGraphSearchcanfurtherenhancetheprogram'ssearchefficiency.Onthisbasis,thispaperemploysanovelmethodknownastheMonteCarlographsearchformaintainingtheglobalgamegraph.Thismethod,bymaintainingaglobalgamegraph,utilizestheexpirednodedeletionalgorithmtoeliminatenodesandedgeswithoutvalue.Additionally,itemploysmeasuressuchasreasoningcalculationsduringtheopponent'sturn,enhancingtheprogram'ssearchefficiency.OurexperimentonHexdemonstratesthismethod,underlimitedcomputingresources,exhibitsanenhancedwinningratecomparedtoalternativesearchstrategies.
作者:徐长明 周其磊 王一川 王栋年 金张根 王军伟 Author:XUChangming ZHOUQilei WANGYichuan WANGDongnian JINZhanggen WANGJunwei
作者单位:东北大学秦皇岛分校计算机与通信工程学院,河北秦皇岛066004东北大学研究生院,河北秦皇岛066004
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(9)
分类号:TP311
关键词:AlphaGo系列算法 计算机博弈 蒙特卡洛图搜索 计算资源
Keywords:AlphaGoseriesalgorithms computer-basedgame MonteCarlographsearch computationalresources
机标分类号:TP391.9TP18TP273
在线出版日期:2024年7月11日
基金项目:河北省自然科学基金面上项目维护全局博弈图的蒙特卡洛图搜索[
期刊论文] 重庆理工大学学报--2024, 38(9)徐长明 周其磊 王一川 王栋年 金张根 王军伟AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展.而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平....参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
维护全局博弈图的蒙特卡洛图搜索 Monte Carlo tree search for maintaining the global game graph
维护全局博弈图的蒙特卡洛图搜索.pdf
- 文件大小:
- 4.14 MB
- 下载次数:
- 60
-
高速下载
|