文档名:强化学习研究进展及其在电脑围棋的应用
在取得电脑围棋突破的AlphaGo系统中,强化学习起到了重要作用.本报告简要介绍国内外强化学习的研究进展,重点关注强化学习中的状态表示、奖赏设计、策略搜索、终身学习以及在电脑围棋上的应用,并展望未来的发展趋势.
作者:俞扬 高阳
作者单位:南京大学计算机科学与技术系,南京CCF人工智能与模式识别专业委员会
母体文献:CCF2015-2016中国计算机科学技术发展报告会论文集
会议名称:CCF2015-2016中国计算机科学技术发展报告会
会议时间:2016年10月1日
会议地点:太原
主办单位:中国计算机学会
语种:chi
分类号:TP3TP1
关键词:电脑围棋 强化学习 状态表示 奖赏设计 策略搜索 终身学习
在线出版日期:2018年11月22日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.87 MB
- 下载次数:
- 60
-
高速下载
|
|