基于强化学习的游戏赛车控制算法的实践开题报告

2022-01-25 23:02:48

全文总字数：3249字

1. 研究目的与意义及国内外研究现状

强化学习（reinforcement learning），是机器学习的一个重要分支，也是当下机器学习最火热的研究领域。强化学习的本质是解决决策问题，针对一个具体问题得到一个最优的策略，使得在该策略下获得的奖励最大。强化学习的思想与人类的学习过程有很大的相似性，因此被认为是迈向通用人工智能的重要途径。

随着数据处理能力的逐步提升以及深度学习的发展，强化学习解决复杂问题的能力也得到了较大的提高，除应用于机器人控制、无人驾驶、游戏博弈，还应用于制造业、电商广告推荐等与我们生活息息相关的领域中。

在无人驾驶的决策过程中，模拟器起着非常重要的作用。决策模拟器负责对环境中常见的场景进行模拟，例如车道情况、路面情况、障碍物分布等。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

2. 研究的基本内容

一、了解课题研究的背景与意义、国内外研究现状。

二、熟悉torcs模拟器的使用。

三、学习并掌握q-learning 等常用的强化学习算法原理即实现。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

3. 实施方案、进度安排及预期效果

实施方案：一、去图书馆或网络上查阅相关的资料，了解该项目的研究价值。

二、通过查阅的资料确定研究方向及研究的可行性。

三、学习基于基于强化学习的控制算法的原理，了解模拟器系统如何工作与运行。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

4. 参考文献

[1]richard sutton.reinforcement learning: an introduction 2017,second edition

[2]morganclaypool.algorithm for reinforcement learning

[3]anschel, o., baram, n., and shimkin, n. (2017). averaged-dqn: variance reduction and stabilization for deep reinforcement learning. in the international conference on machine learning (icml).

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码