基于DRL算法的船舶路径规划方法研究与实现任务书
2020-02-20 08:26:36
1. 毕业设计(论文)主要内容:
1.前期知识储备:通过阅读相关文献,了解强化学习、PPO算法、路径规划、python、tensorflow、Open AI gym平台等相关知识。
2.设计功能:
本设计的任务包括:
1)了解强化学习基础概念、PPO算法及其源码,了解路径规划相关知识,分析船舶路径规划的特点,设计高效的船舶路径规划算法;
2)熟悉实验平台Open AI gym,基于该平台,使用python、tensorflow等完成自定义路径规划环境的编码实现(需要能自定义地图的尺寸,随机设置障碍物,定义智能体、起止点、任务),通过在在自定义环境中运行PPO算法并完成任务测试环境是否构造成功;
3)在2)中的自定义环境中实现、验证和分析所设计的路径规划算法。
2. 毕业设计(论文)主要任务及要求
1.查阅15篇相关文献(不少于3篇外文文献),并每篇书写200—300字文献摘要(装订成册,带封面);
2.认真填写周记,完成至少1500字开题报告(“设计的目的及意义”至少800汉字;“基本内容和技术方案”至少400汉字;进度安排应尽可能详细;);
3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
4.完成方法研究、算法设计与实现;
5.按武汉理工大学理工类本科生毕业论文撰写规范撰写毕业论文,完成10000字以上的毕业论文;
6.进行论文答辩。
3. 毕业设计(论文)完成任务的计划与安排
1.2019/1/19—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
2.2019/3/1—2019/4/30:系统架构、程序设计与开发、系统测试与完善;
3.2019/5/1—2019/5/25:撰写及修改毕业论文;
4.2019/5/26—2019/6/5:准备答辩。
4. 主要参考文献
[ [[1 [1] 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[j].计算机学报,2018,41(01):1-27.
[2] francois-lavet v , henderson p , islam r , et al. an introduction to deep reinforcement learning[m]. usa: foundations and trend in machine learning,2018,1-140. doi: 10.1561/2200000071.
[3]lillicrap, timothy p., et al. continuous control with deep reinforcement learning. arxiv preprint arxiv:1509.02971 (2015).
[4] schulman j, wolski f, dhariwal p, et al. proximal policy optimization algorithms. arxiv preprint arxiv:1707.06347 (2017).
[5] radmanesh m , kumar m , guentert p h , et al. overview of path planning and obstacle avoidance algorithms for uavs: a comparative study[j]. unmanned systems, 2018, 6(2): 1–24.
[6]范云生,赵永生,石林龙,张月.基于电子海图栅格化的无人水面艇全局路径规划[j].中国航海,2017,40(01):47-52 113.
[7]薛飞. 基于无人船的路径规划与避障问题研究[d].哈尔滨工程大学,2017.
[8]姚君延. 基于深度增强学习的路径规划算法研究[d].电子科技大学,2018.
[9]董培方,张志安,梅新虎,朱朔.引入势场及陷阱搜索的强化学习路径规划算法[j].计算机工程与应用,2018,54(16):129-134.
[10]侯春晓,许劲松,杨荣武.内河无人船局部路径规划和循迹控制[j].船舶工程,2017,39(06):41-45.
[11]康与涛,朱大奇,陈伟炯.船舶避碰路径规划研究综述[j].船海工程,2013,42(05):141-145.
[12]杜哲,文元桥,黄亮,周春辉,肖长诗.基于动态复杂度地图的船舶航迹规划[j].系统仿真学报,2018,30(06):2390-2397 2404.