基于遥感影像的船舶目标识别方法研究毕业论文
2021-12-11 18:09:19
论文总字数:18006字
摘 要
本文研究了卷积神经网络模型和孪生卷积神经网络模型分别对遥感的图片和视频中的船舶进行识别和跟踪,再对实验结果进行分析和验证,对卷积神经网络模型和卷积孪生网络模型进行改进使它们能够有效处理基于遥感的船舶识别和跟踪任务。所得结果说明深度学习方法可以有效处理及与遥感的船舶识别任务。
本文着重在研究基于遥感图像的舰船目标识别的深度学习方法中使用卷积神经网络 。
结果表明,与传统算法相比,卷积神经网络在识别和跟踪船舶目标时具有较高的精度和稳定性。
本文的特色:运用深度学习方法,针对遥感图像中的船舶目标进行识别,对遥感视频中的运动船舶目标进行识别和跟踪。
关键词:深度学习;卷积神经网络;目标检测
Abstract
In this paper, the identification and tracking of ships in remote sensing pictures and videos are investigated by the convolutional neural network model and the dual convolutional neural network model, respectively, and the experimental results are analyzed and validated. The results obtained illustrate that the deep learning approach can be effective in handling and processing remote sensing ship identification tasks.
The paper focuses on the use of convolutional neural networks in deep learning methods for processing remote sensing image-based ship target recognition.
The vessels which are in the images and videos of remoting are identified and tracked by convolutional neural network that is more exactness and toughness compared with prescriptive algorithms.
This paper features: identification of ship targets in remote sensing images, identification and tracking of moving ship targets in remote sensing videos.
Key Words:deep learning;convolutional neural network;object detection;object tracking
目录
第1章 绪论 1
1.1 选题背景与意义 1
1.2 国内研究现状 1
1.3 国外研究现状 2
第2章 深度学习的目标检测基础理论 3
2.1 深度学习概述 3
2.1.1基本概念 3
2.1.2常用模型分类 3
2.2卷积神经网络 4
2.2.1卷积神经网络结构 5
2.2.2前向传播 7
2.2.3反向传播 7
2.2.4核心策略 8
第3章 基于yolov3算法的船舶目标检测 10
3.1yolov3算法概述 10
3.2数据集建立 12
3.3 训练yolov3模型 13
3.4初步实验结果分析 14
3.5错误分析 14
3.6 模型改进 15
3.6.1 数据增强 15
3.6.2 Anchors free 16
3.6.3 Focal loss 16
3.6.4 DIOU 17
3.7改进后实验分析 19
3.8本章小结 19
第4章 基于孪生卷积网络算法的船舶跟踪检测 20
4.2孪生卷积网络算法概述 20
4.3 训练孪生网络模型 23
4.4初步实验结果 24
4.5错误分析 24
4.6 改进方法 25
4.7改进后实验分析 25
4.8本章小结 26
第5章 本文总结 27
第1章 绪论
1.1 选题背景与意义
基于遥感影像的船舶检测是一项关乎海洋安全,海洋资源保护,航行安全保障的任。可以帮助海事管理部门对于船舶运动轨迹进行分析,确定事故责任,还可以保障海事监管部门对于打击走私船,私自捕鱼等违法违规行为。在国防方面基于遥感影像可以用于掌握敌人船舶的精确位置,为我方舰队提供重要的战略信息,也可用于无人机制导等具体任。
目前,世界上海事部门和船舶自身使用的监测手段为船舶自动识别系统进行主动和被动识别检测,在使用过程中易受到雨雪、海浪及其他电磁的干扰,具有很大的局限。随着遥感领域,卫星技术的快速发展,使用遥感技术对船舶进行视觉检测的能力得到大幅度的提升,很大程度上改善了军用和民用的船舶识别和监测手。相对于用合成孔径雷达拍摄的SAR影像,用高分辨率光学相机拍摄的影像具有分辨率高和直观表达的特点,能够有效地服务于基于遥感的船舶识别任。海上的环境极其复杂,包括云层,浓雾,海浪等可能会影响船舶识别的各种环境。因此针对于基于遥感影像的船舶识别需要一种具有高可靠性的算法,同时应该兼有高鲁棒性。本文主要研究适用于基于遥感图像的船舶识别的深度学习算法,达到快速识别遥感影像中的船舶的任务。
1.2 国内研究现状
经典的遥感图像目标识别方法主要基于图像处理的一些经典算法例如特征子提取,分割阈值等方法,例如王保云提出的多阶阈值分割方法,能够保持错检率不变的基础上提高准确度。Yang 针对海面特征提出船舶检测算法。Qi提出首先提出船舶的搜索区域,利用梯度直方图对船舶进行识别。Shi人提出的一种船舶识别方法,通过分离船舶和海面背景来提取目标船舶。这些经典的算法,由于理论成熟,高效便捷得到了充分的认可,但对于复杂的环境,以及遥感图像的各种存在的问题,使得这些经典算法的准确率和鲁棒性较差,无法达到实时处理识别船舶的任务。随着人工智能的发展,机器学习,深度学习的应用以及大规模数据集的出现,快速准确地识别遥感图像中的船舶成为一种可能。与经典的图像处理算法相比,深度学习的算法由于其特征提取的优势和其神经网络的泛化能力,对于图像理解有着极其有效的运用。有很多学者已经将其运用在基于遥感的船舶识别中,刘峰以AlexNet网络模型为基础,融合三种波段的光谱图像后进行特征提取和船舶目标检测识别,提高了遥感船舶识别的准确率。Tang 提出了深度神经网络和极限学习机结合来进行船舶识别的方法。Zhang 提出了船舶卷积网络算法,将经典检测算法和卷积神经网络相结合,有效地提高了检测的准确率。Liu 采用了深度卷积神经网络进行船舶目标识别。
1.3 国外研究现状
在2014年的CVPR大会上, Ross Girshick提出基于卷积神经网络的RCNN算法,滑动窗口被选择性搜索所替代,使得VOC2012 数据集上的平均检测准确率获得30%的提升。随着Fast R-CNN和Faster R-CNN的提出。引入了区域候选算法的 Faster R-CNN 可以使检测帧速率达到5fps,无论是候选区域的提取速度和准确度都有了较大幅度的上。YOLO 模型由 Joseph Redmon 建立,该模型将检测速度达到了实时检测。2018 年Joseph Redmon 又提出了YOLOv3网络模型,提出了一种更加高效的特征提取网络,使目标检测的准确率和实时性能有大幅度地提升
第2章 深度学习的目标检测基础理论
近年来,人工智能渗透到各行各业,成为促进各行各业蓬勃发展的催化剂尤其是交通运输行业。目前,水路运输领域从业人员对于无人驾驶船舶和智能船舶的发展的需求,极大地促进了人工智能技术在于船舶领域的运用。深度学习作为人工智能的一个子集或者说深度学习是人工智能的一个基础理论。本章详细地介绍深度学习的概念,模型以及本文所使用的卷积神经网络的基本理论和经典模型。为下一章基于深度学习的遥感船舶识别检测奠定了基础。
2.1 深度学习概述
2.1.1基本概念
作为人工智能重要技术的机器学习,有别于一般的编程方法。在经典的程序设计中,研究者输入一定的算法,通过封装算法处理输入的数据得到结果。但是在机器学习中,则是输入数据人为设置结果最后通过机器学习来得到一定的规律,如图2.1所示
图2.1 机器学习
深度学习算法被包含在机器学习理论中,是机器学习的一种特殊形式。深度学习利用非常多的层的网络结构从数据中提取特征表示,层对应的是数据中的特征。与机器学习相比,深度学习拥有许多层,一般来说这些层要通过训练数据进行学习以达到学习表示的目的。相反,其他的机器学习算法只学习几层的数据特征,相对与深度学习方法这种技术一般被称为浅层学习。
随着计算神经学和生物学的发展,研究人员快速地了解到人类的学习和认识世界的能力来自于人类大脑中的神经网络相互重叠连接,然而深度学习所使用的神经网络并不是对于人类大脑的仿真,没有证据表明深度学习模型与人类大脑的工作原理相同。其中最为关键和核心的方法为神经网络,它是一种从数据中学习表示的数学模型,它能够将数据抽象表示为其能够理解的复杂抽象的概念信息。
2.1.2常用模型分类
普通的模型一般分为三个类别:有监督学习模型,它的目前在学术界最为流行的形式为卷积神经网络;无监督学习模型,它被人们所熟知的典型模型为深度自编码器;然后还有一种介于两者之间的模型,半监督学习模型,它目前被研究人员所一般接受的形式是生成对抗网络;监督学习是最常见的模型,其中的卷积神经网络将在2.2节中具体介绍。其定义为:给定一组人工标注的数据例如人工标注标签的图像其中标签为目标的类别,通过优化找到数据和标签的映射。
无监督学习指在不给定人工标注的标签的情况下,对数据进行学习,以找到输入数据的合适的变化。通常在数据压缩和数据去噪等数据处理的情况下使用它。
半监督学习区别在于通过算法产生标签,这个标签是期望目标。
2.2卷积神经网络
它是具有权值共享(也一般成为参数共享),相对于密集连接的稀疏连接以及聚合等独特特点的复合前向反馈的人工网络。它往往用于图像的处理,相较于密集连接层学习的全局特征,而卷积神经网络能够提取多样信息则是属于局部的特征信息。针对于图像它可以提取到图像的边缘纹路细节等细微但肉眼可见的特征等如图2.2所示。
图2.2 局部特征
作为处理图像信息特别有效的卷积神经网络具有显而易见的独特性质:(1)针对平移的图像它依然能够识别出其平移前的特征,深度卷积神经网络在任意位置学习到某个具体的特征,它可在另一任意位置识别出学习到的特征。例如在左下角学习到的某一具体特征当其平移到右上角时,卷积神经网络依然可以识别出其学习到的特征。(2)卷积神经网络能够学习分层结构特征。由于分层,不同的卷积层可以学习异化的分层特征,较低层可以学习到局部特征,而较高层可以组合较低层学习到的局部特征成为全局特征,从而可以得到更加抽象和概念性的视觉信息。
生物学上的感受野机制促进了卷积神经网络的提出。在视觉形成的环节中,光通过视网膜上的光感受细胞,将其转化为神经信号。卷积神经网络输出的特征图上的一个像素点所对应的输入图像上所对应的区域。
卷积神经网络一般用于目标检测,语义分割,目标跟踪等面向图像和视频的理解分析,其准确率一般要比其他的神经网络模型更高。因此在处理图像信息时
2.2.1卷积神经网络结构
图2.3 典型卷积网络
如图2.3所示,一般的经典卷积神经网络具有如下的功能模块,具体包括用于输入图像的输入层,进行运算的卷积层,优化卷积参数的汇集层(池化层),以及最后输出结果的输出层(全连接层),激活函数
其中作为核心的卷积层是由独立的包含各个参数的计算单元-卷积元组成,卷积层有很多个通道,对于卷积神经计算单元中的待计算的参数通过反向传播优化。针对于图像,卷积可以将图像的二维信息通过运算提取出其关键内容,经过卷积处理的图像一般被称为特征图。
卷积运算是实分析中的一种重要运算,设f(x),g(x)是R上的可积函数:
(2.1)
证明几乎所有实数x都具有上述积分称为函数f和函数g的卷积。
如图2.4所示,这副图表示了针对图像的二维卷积的示例。
图2.4 二维卷积的范例
汇集层:也叫池化层。池化层的作用是降低网络中的过于富集的信息,对图片进行缩小处理,提高运行效率减少存储空间使得算法能够更加高效。虽然卷积层可以部分减少网络中的参数个数,但减少的程度很有限,因此网络中只存在卷积层的情况很容易造成数据上的过拟合,因此采用池化层可降低特征图维数,减弱过拟合。
汇集层一般分为最大汇集层和平均汇集层两种类型:(1)最大汇集层:取一个区域的卷积单元的最大值。(2)平均汇集层:取一个区域的所有卷积单元的平均值。
激活函数:为了得到更加丰富的假设空间,将线性变换转化为非线性变换,扩大网络的假设空间,丰富网络提取的信息。下面介绍常用的两种激活函数。
Sigmoid函数:由于其取值范围为[0,1],所以经常用来作为判断是否存在目标的损失函数。下面的公式为Sigmoid函数公式。:
(2.2)
如图2.5所示为sigmoid函数曲线。
图2.5 sigmoid函数
请支付后下载全文,论文总字数:18006字