基于强化学习的五子棋alpha-gomoku开题报告
2020-04-06 11:11:34
1. 研究目的与意义(文献综述)
1.1目的及意义
2011年4月,德国政府在汉诺威工业博览会上提出了“工业4.0”战略。2015年5月19日,中国国务院李克强总理提出了“中国制造2025”的国家战略。2016年3月,谷歌deepmind团队研发的基于深度强化学习的alphago围棋程序以4:1的大比分战胜来自韩国的世界顶级围棋高手李世石(lee sedol)。这成为人工智能世界的里程碑事件,在全世界的范围内,引起了人们对于人工智能的关注,引起了大批学者和学生对于深度强化学习的研究。
2. 研究的基本内容与方案
2.1 研究的基本内容
本文研究的基本内容是了解并掌握强化学习算法,学习五子棋下棋方法以及五子棋对弈软件的开发。
2.2 研究的目标
3. 研究计划与安排
第1-2周 确定选题,英文文献翻译
第3-4周 查阅文献,撰写开题报告
第5-10周 设计与实现
4. 参考文献(12篇以上)
1. 赵冬斌, 邵坤, 朱圆恒,等. 深度强化学习综述:兼论计算机围棋的发展[j]. 控制理论与应用, 2016, 33(6):701-717.
2. zhao d,zhang z, dai y. self-teaching adaptive dynamic programming for gomoku[j].neurocomputing, 2012, 78(1): 23-29.
3. 阿尔法狗原理解析http://blog.csdn.net/hereiskxm/article/details/52044089