基于神经网络的人体行为分析与研究毕业论文
2021-10-28 20:34:47
摘 要
本文基于人体行为识别数据集UCF101和深度学习框架Pytorch进行人体行为识别方法的探究。为了匹配目前具备的运算力,对UCF101数据集进行适应性裁剪。并通过实验决定在二维卷积的基础上进行人体行为识别算法的实现。本文通过实验,对AlexNet、LeNet、VGG等二维卷积网络模型进行比较,并结合各个模型的识别效果,提出了一种针对本文数据集识别率更高的网络模型。在确定网络模型之后,为了进一步提高算法的识别精度,进行了数据增强、优化器筛选、实验调参等一系列的优化操作,达到比较高的识别精度。最后,本文制作了一个交互界面来进行算法识别效果的演示,以此来体现项目的完整性。
关键词:人体行为识别;UCF101;Pytorch;网络模型
Abstract
This paper explores the human behavior recognition method based on the human behavior recognition data set UCF101 and the deep learning framework Pytorch. In order to match the current computing power, the UCF101 data set is adaptively tailored. And through experiments, it is decided to implement the human behavior recognition algorithm based on the two-dimensional convolution.Through experiments, this paper compares two-dimensional convolutional network models such as AlexNet, LeNet, VGG, etc., and combines the recognition effects of each model, a network model with higher recognition rate for this data set is proposed. After determining the network model, in order to further improve the recognition accuracy of the algorithm, a series of optimization operations such as data enhancement, optimizer screening, and experimental tuning were carried out to achieve a higher recognition accuracy.Finally, in order to reflect the integrity of the project, an interactive interface was innovatively created to demonstrate the algorithm recognition effect.
Key Words:human behavior recognition; UCF101; Pytorch; network model
目 录
第1章 绪论 1
1.1 研究背景 1
1.2 研究现状 1
1.3 研究内容 1
第2章 卷积神经网络的基础知识 3
2.1 卷积神经网络的网络结构 3
2.2卷积层 3
2.2.1卷积运算 3
2.2.2卷积层的作用 4
2.3池化层 4
2.4全连接层 4
2.5本章小结 5
第3章 基于卷积神经的行为识别算法设计与实现 6
3.1算法实现依赖条件 6
3.1.1开发环境 6
3.1.2数据集 6
3.2算法模块化设计 7
3.2.1数据的导入 7
3.2.2训练函数 8
3.2.3训练输出与识别效果的可视化 9
3.2.4优化器的选择 11
3.3本章小结 13
第4章 网络模型效果比较 14
4.1 LeNet 14
4.2 AlexNet 15
4.3 VGG 16
4.4本章小结 18
第5章 网络结构的设计及优化 19
5.1网络的结构 19
5.2网络的优化 19
5.2.1数据增强 19
5.2.2 batch_size优化 20
5.2.3 Dropout 20
5.2.4卷积层输出通道数量的优化 20
5.3交互界面 21
5.4本章小结 22
第6章 总结 23
参考文献 24
致 谢 26
第1章 绪论
1.1 研究背景
目前,获取视频和图像数据的途径多种多样,人们对这些数据的依赖也越来越深。与之而来的,是视频和图像处理技术的迅速发展。基于视频的人体行为识别技术就是其中重要的一种,这项技术的目标是能够自动分析出视频中的人,在什么时间、什么地点、做了什么事[1]。由于这项技术能自动识别人体的行为,其应用场景十分广泛。例如在医院可监控是否有老人摔倒,在安防领域,可自动监控是否有打架斗殴事件的发生等等。并且随着电子设备运算能力的不断提高和人工智能的飞速发展,基于计算机视觉的人体行为识别技术势必会有更多的应用场景。
1.2 国内外研究现状
在国内,人体行为识别技术有了一些简单的应用。例如在公共场合,通过摄像头采集视频和图像数据,来监控非法行为。但是由于视频中场景的复杂度、视频获取途径的复杂度以及人的行为的复杂度,使得基于视频的人体行为识别仍然具有很大的难度[2]。
由于应用潜力大、技术实现有难度,在加上近些年科技的蓬勃发展,以及芯片计算技术的大幅提升等,这一系列的条件,使得人体行为识别受到了国内外很多研究学者的重视。
作为一个热门的研究领域,长久以来,人体行为识别已经得到了很大的发展。尤其是国外学者对人体行为识别技术的研究展开较早,已经有了较为系统的研究方法。经过对常用的识别视频人体行为方法的总结,其处理流程可分为数据预处理、运动人体检测、运动特征提取和行为识别四个步骤,特征提取是其中最为关键的一步。而根据特征提取的方式不同,人体行为识别的研究方法分为两种:一种是基于较为传统的手动提取特征方法,另一种是基于近些年发展较快的深度网络学习特征的方法。基于深度学习的方法又大致可分为2D卷积神经网络和3D卷积神经网络。
面对不同规模的数据集时,需要不同的网络层数。对于小型数据集,可以采用较为浅层的网络,而对于大型甚至超大规模的数据集时,就需要更为深层的网络了。因此,不同类别的方法,按照网络层数的不同,又可以分为浅层神经网络和深层神经网络。
人体行为识别技术的发展还与相关数据集的发展有关,随着越来越大规模数据集的诞生,对人体行为识别算法的要求越来越严苛[3]。作为人工智能领域的热门方向,人体行为识别这一技术还有很长的路要走。
1.3研究内容
本文对人体行为识别方法的分析和研究基于神经网络,研究的主要内容有如下几点: