基于卷积神经网络的道路场景语义分割毕业论文
2021-10-26 21:58:54
摘 要
在交通运输蓬勃发展的当今社会,道路已经是人们生活之中离不开的元素,对道路图像的研究可以说是十分的重要,而道路场景语义分割在道路图像的研究中具有十分重要的意义,对道路场景进行语义分割,就是将道路中不同的元素、事物区别开来,使机器能够进行识别,对于人工智能技术和自动驾驶技术的实现有很大帮助。
本文主要通过基于卷积神经网络的方法对道路场景进行分割,主要使用DeepLabv3 网络模型对Camvid数据集进行训练与测试,本次设计运用Tensorflow计算框架,经过训练出来的图片基本达到了对原图片进行准确的语义分割的目的,说明DeepLabv3 作为一个网络训练模型有很好的分割精度和稳定性。
关键词:深度学习;卷积神经网络;Camvid数据集;Tensorflow;DeepLab v3
Abstract
In today's society with the vigorous development of transportation, road has become an indispensable element in people's life, and the research on road image can be said to be very important. The semantic segmentation of road scene has a very important significance in the research of road image. The semantic segmentation of road scene is to distinguish different elements and things in the road, so that machines can enter row recognition is very helpful to the realization of artificial intelligence technology and automatic driving technology.
In this paper, the method of convolution neural network is used to segment the road scene, and the DeepLabv3 network model is mainly used to train and test Camvid data set. In this design, the tensorflow computing framework is used, and the trained pictures basically achieve the purpose of accurate semantic segmentation of the original pictures, which shows that DeepLabv3 as a network training model is very good segmentation accuracy and stability.
Key Words: Deep learning; convolutional neural network; Camvid data set; Tensorflow; DeepLab V3
目录
摘 要 I
Abstract II
第1章 绪论 1
1.1 研究背景以及意义 1
1.2 国内外的研究现状 2
1.3 本文的研究内容及章节安排 3
第2章 卷积神经网络语义分割 4
2.1 传统语义分割技术 4
2.2 卷积神经网络结构 4
2.2.1卷积层 4
2.2.2池化层 6
2.2.3全连接层 7
2.3 Camvid数据集 7
2.4本章小结 8
第3章 DeepLab V3 原理 9
3.1 Tensorflow 9
3.2 ResNet结构与实现 9
3.3 DeepLab的发展与优化 12
3.3.1 空洞卷积 12
3.3.2空间金字塔池化 13
3.3.3 Batch Normalization 14
3.3.4编码器-解码器结构 14
3.4本章小结 15
第4章 模型的训练测试结果 17
4.1环境搭建及准备工作 17
4.2 评价标准IoU交并比 19
4.3训练结果 19
4.4 测试结果 21
4.5 本章小结 22
5章 总结与展望 23
参考文献 24
致谢 26
第1章 绪论
1.1 研究背景以及意义
交通事故以及严重的交通堵塞等道路安全问题愈发频繁。而自动驾驶机器学习技术的一个重要发展特点就是可以有效的缓解这些道路安全问题,图像和语义的分割就是自动驾驶机器学习技术中不可或缺的重要一环,准确的对数据集和道路图像语义进行的分割技术可以大大增强自动驾驶机器学习技术的道路安全性,提高自动驾驶机器学习技术的实用性。深度机器学习技术是一种基于图像学习对象和数据表示的对象进行机器学习的方法,而不是特定的机器学习算法。利用深度机器学习技术能够有效的使得计算机从更简单和更小的机器学习概念集中构建复杂的机器学习概念。本文将利用深度机器学习数据集中的卷积技术将神经网络与数据集和道路图像语义的分割技术结合了起来,对数据集Camvid两个数据集的可靠性进行了训练和测试,得到较好的语义分割效果和精度。
通过对车辆自动行驶道路场景中的各种重要目标区域进行语义分割,提取出在车辆前方可以正常通行的车辆和道路目标区域,为车辆智能自动驾驶系统的正常通行路径规划和设计及车辆自动化控制系统提供与道路相关的信息,具有重要的技术性和现实意义[5]。
图像语义分割也需要完成这样两个任务:图像语义识别和图像分割[1]。语义在图像领域是指图像中客观对象的类别等信息,对图像语义的识别即要求分辨图像中的对象是什么,不同于目标检测采用候选框分割对象,图像语义分割是对图像进行像素级别的分类,以实现对对象的精确定位、完整地呈现其轮廓特征。