返回列表 发布新帖

结合A2C和手牌估值方法的麻将博弈研究

20 0
admin 发表于 2024-12-14 04:05 | 查看全部 阅读模式

文档名:结合A2C和手牌估值方法的麻将博弈研究
摘要:针对大众麻将中对手牌信息利用不充分的问题,提出了手牌估值方法,并设计了基础麻将程序(MJE).为进一步提升麻将AI的博弈能力,使用深度强化学习方法设计了麻将AI(MJE-RL).首先,通过MJE自对弈生成深度学习的训练数据.其次,根据训练集、测试集和对比实验的结果,选择效果最好的模型作为强化学习的预训练模型.最后,使用优势演说-评论家模型作为强化学习的主要框架,将训练好的深度学习模型作为演说家部分进行决策,通过MJE-RL与MJE的对弈不断提升麻将AI的博弈能力.实验结果显示,MJE-RL的胜率比MJE高4.08%,点炮率比MJE低3.02%,表明MJE-RL在攻守两端都有提升,达到了提升麻将AI牌力的目的.

Abstract:Toaddresstheunderutilizinghandinformationinpopularmahjong,thispaperdesignsahandvaluationmethodandabasicmahjongprogram(MJE).MahjongAI(MJE-RL)isdesignedbyusingthedeepreinforcementlearningapproachtofurtherimproveitsgamingability.First,thetrainingdataofdeeplearningisgeneratedbyMJE'sself-play.Second,thebestmodelisselectedasthepre-trainingmodelofreinforcementlearning,accordingtotheresultsoftrainingset,testsetandcomparisonexperiment.Finally,theAdvantageActor-Critic(A2C)modelisemployedasthemainframeworkofreinforcementlearning.Thewell-traineddeeplearningmodelisusedastheActortomakedecisions,andthegameabilityofmahjongAIisconstantlyimprovedbyplayingbetweenMJE-RLandMJE.OurexperimentalresultsindicatethewinningrateofMJE-RLis4.08%higherthanthatofMJEandtherateofWinbyDiscardis3.02%lowerthanthatofMJE.Meanwhile,itisshownthatMJE-RLmarkedlyimprovesbothoffensiveanddefensivefronts,demonstratingimprovedoverallstrengthofmahjongAI.

作者:衣御寒  王亚杰  吴燕燕  刘松  张兴慧  蒋传禹Author:YIYuhan  WANGYajie  WUYanyan  LIUSong  ZHANGXinghui  JIANGChuanyu
作者单位:沈阳航空航天大学工程训练中心,沈阳110136
刊名:重庆理工大学学报 PKU
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(9)
分类号:TP18
关键词:麻将  非完备信息  深度强化学习  A2C  
Keywords:popularmahjong  incompleteinformation  deepreinforcementlearning  A2C  
机标分类号:TP391TP181F113
在线出版日期:2024年7月11日
基金项目:辽宁省兴辽英才计划项目结合A2C和手牌估值方法的麻将博弈研究[
期刊论文]  重庆理工大学学报--2024, 38(9)衣御寒  王亚杰  吴燕燕  刘松  张兴慧  蒋传禹针对大众麻将中对手牌信息利用不充分的问题,提出了手牌估值方法,并设计了基础麻将程序(MJE).为进一步提升麻将AI的博弈能力,使用深度强化学习方法设计了麻将AI(MJE-RL).首先,通过MJE自对弈生成深度学习的训练数据.其次...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        结合A2C和手牌估值方法的麻将博弈研究  Research on mahjong game combining A2C with hand value evaluation method

结合A2C和手牌估值方法的麻将博弈研究.pdf
2024-12-14 04:05 上传
文件大小:
6 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表