基于机器学习的人群密度检测研究与应用毕业论文
2021-12-23 20:43:58
论文总字数:21484字
摘 要
随着人群的增长和人群活动的多样化,人群流动性导致了各种各样的问题。其中最典型的就是踩踏事故,如果说能在踩踏事故发生概率较大的地方进行预警,提前进行疏散工作,就可以防止踩踏事故的发生。还有很多大型会议会统计人数,一个个数又太麻烦这时就需要一个简单的方式获取人数。人数过多导致的问题有大有小,所以人群密度检测成为了机器学习研究的热点问题。但是由于图片噪声、图片分辨率不统一、图片失真等问题,使得人群密度检测的难度会很大。
卷积神经网络是很方便进行图像处理的网络。本文研究了卷积神经网络和深度学习框架,使用python实现了一种由两种类型的卷积神经网络连接成的深度卷积神经网络。模型将图片转换为张量,通过网络结构将其转换人群密度图求和计数得到人数。模型的输入是任意尺寸的图片,先通过高斯滤波处理噪声和平滑图像,再将图片转换为张量。通过多层卷积神经网络的学习,能够适应图片失真和分辨率不统一,精确计算人群人数。使用了深度学习的框架,使得特征更完整,提高了人群密度检测的准确率。
关键词:机器学习 深度学习 密度图 卷积神经网络 人群密度
Research and Application of Crowd Density Detection Based on Machine Learning
Abstract
With the growth of the crowd and the diversification of crowd activities, crowd mobility has led to various problems. One of the most typical is the stampede accident. If early warning and early evacuation can be carried out in places with high probability of stampede accidents, stampede accidents can be prevented. There are also many large-scale conferences that will count the number of people. If one number is too troublesome, a simple way to get the number of people is needed. The problems caused by too many people vary from large to small, so crowd density detection has become a hot topic in machine learning research. However, due to the problems of image noise, nonuniform resolution and distortion, it is very difficult to detect the population density.
Convolution neural network is a very convenient network for image processing. In this paper, convolutional neural network and deep learning framework are studied. python is used to implement a deep convolutional neural network composed of two types of convolutional neural networks. The model converts the pictures into tensors, and sums and counts the converted crowd density maps through the network structure to obtain the number of people. The input of the model is pictures of any size. Firstly, the noise and smooth images are processed by Gaussian filtering, and then the pictures are converted into tensors. Through the learning of multi-layer convolution neural network, it can adapt to the distortion of pictures and non-uniform resolution, and accurately calculate the number of people. The framework of deep learning is used to make the features more complete and improve the accuracy of crowd density detection.
Key words: Machine learning;Deep learning;Density map;CNN;Crowd density
目录
摘 要 I
Abstract II
第一章 绪论 1
1.1 研究背景及意义 1
1.2 研究现状 1
1.3 论文主要研究内容 2
1.4 论文文章结构 2
第二章 相关理论和算法 4
2.1 感知机 4
2.2 人工神经网络 5
2.2.1 人工神经网络介绍 5
2.2.2 人工神经网络的优点 6
2.3 卷积神经网络(CNN) 6
2.4 VGG网络 7
2.4.1 VGG网络结构配置 7
2.4.2 VGG网络的特点 8
2.5 空洞卷积神经网络 9
2.5.1 卷积神经网络的感受野 9
2.5.2 空洞卷积 9
2.5.3 空洞卷积神经网络 10
2.6 数据预处理(data preprocessing) 10
2.6.1 数据预处理介绍 10
2.6.2 高斯滤波器 11
2.6.3 归一化 11
2.7 本章小结 12
第三章 人群密度检测模型的构建 13
3.1 网络结构 13
3.2 构建前端网络 13
3.2.1 VGG网络卷积池化结构配置 13
3.2.2 VGG网络构建 14
3.3 构建后端网络 15
3.3.1 网络结构 15
3.3.2 网络配置 15
3.4 参数的加载与初始化 16
3.5 本章小结 17
第四章 模型训练 18
4.1 模型训练流程 18
4.2 数据预处理 19
4.3 解析器与训练参数设置 20
4.3.1 创建解析器 20
4.3.2 解析器参数设置 20
4.4 损失函数 21
4.5 本章小结 21
第五章 模型测试与模型评估 22
5.1 模型测试 22
5.2 模型评估 23
第六章 总结与展望 27
6.1 总结 27
6.2 展望 27
参考文献 28
致 谢 31
绪论
1.1 研究背景及意义
人群的增长会增大人群的流动性,人群人数一旦过多就会造成拥挤甚至踩踏事故,人群密度识别成为图像处理的一个重点研究对象。早期的研究是基于检测的方法,主要训练分类器,通过行人的小波,边缘特征等检测行人,主要以头部或身体为主。现阶段,人群密度检测以人群密度图的回归为主,通过密度图的值求和求得人群的数量。因为这种方法取得的效果比基于检测的方法更好。但是,图像也存在其他问题,因为图像可能分辨率不同又或者有噪声、失真等情况,人群密度检测还是一个非常具有难度的任务。分辨率不同,人群图像中人的大小也不同,所以要求网络必须有处理分辨率不同和失真的稳定性,进行密集采样。
人群密度过高可能会造成踩踏事故等,如图1-1所示,计算机对场景中的人群进行分析,仅需要在特定区域安装视频监控,就能完成对人群密度的检测。若能估计出人群密度,就能检测出超过阈值的场景,可以针对性加强监控,加强安保工作。当然人群密度检测还能应用于其他场景,如计算大型会议人数或检测街道人数等。
请支付后下载全文,论文总字数:21484字