基于强化学习的游戏赛车控制算法的实践开题报告
2022-01-25 23:02:48
全文总字数:3249字
1. 研究目的与意义及国内外研究现状
强化学习(reinforcement learning),是机器学习的一个重要分支,也是当下机器学习最火热的研究领域。强化学习的本质是解决决策问题,针对一个具体问题得到一个最优的策略,使得在该策略下获得的奖励最大。强化学习的思想与人类的学习过程有很大的相似性,因此被认为是迈向通用人工智能的重要途径。
随着数据处理能力的逐步提升以及深度学习的发展,强化学习解决复杂问题的能力也得到了较大的提高,除应用于机器人控制、无人驾驶、游戏博弈,还应用于制造业、电商广告推荐等与我们生活息息相关的领域中。
在无人驾驶的决策过程中,模拟器起着非常重要的作用。决策模拟器负责对环境中常见的场景进行模拟,例如车道情况、路面情况、障碍物分布等。
2. 研究的基本内容
一、了解课题研究的背景与意义、国内外研究现状。
二、熟悉torcs模拟器的使用。
三、学习并掌握q-learning 等常用的强化学习算法原理即实现。
3. 实施方案、进度安排及预期效果
实施方案:一、去图书馆或网络上查阅相关的资料,了解该项目的研究价值。
二、通过查阅的资料确定研究方向及研究的可行性。
三、学习基于基于强化学习的控制算法的原理,了解模拟器系统如何工作与运行。
4. 参考文献
[1]richard sutton.reinforcement learning: an introduction 2017,second edition
[2]morganclaypool.algorithm for reinforcement learning
[3]anschel, o., baram, n., and shimkin, n. (2017). averaged-dqn: variance reduction and stabilization for deep reinforcement learning. in the international conference on machine learning (icml).