基于深度学习的行为识别研究开题报告
2020-02-20 08:14:57
1. 研究目的与意义(文献综述)
随着信息科技的不断发展,人工智能迎来了前所未有的机遇和挑战。计算机视觉作为ai方面的一员,也迎来了巨大的发展并且有着不错的前景。计算机视觉就是让计算机、摄像头等机器如同人类一样接受信息,分析处理语义信息,并作出应对策略。人体动作识别作为计算机视觉领域的一个重要研究方向,一直被人们视为重点研究对象。人体动作识别技术具有很高的市场价值,在智能控制、运动分析、人机交互以及医疗监护等领域有着广阔的应用前景。因此基于深度学习的行为识别研究是一个具有重要意义的课题。
人体动作识别技术在计算机视觉领域里逐渐成为主流研究内容,已经成为了计算机视觉领域中的一项重要应用。动作识别的应用场景有以下两个方面:传统的视频监控系统一般是靠人来操控监控设备并使用人眼来识别和分析,人工识别和分析监控视频会大大降低监控的有效性和准确性。且人工操作会得到一个不全面的结果。因此,利用计算机视觉的人体动作识别方法来代替传统方法切实可行;人机交互旨在人与机器进行无差别交互,人类能够通过肢体语言或者自然语言流畅地与机器沟通,并且机器可以遵循人类的指示出色的完成各种工作。达到机器替代人类工作这一目的,实现这一美好的夙愿,则需要机器能够完全理解视觉中的人类及其肢体动作。
近年来深度学习被广泛的应用到人体动作识别领域,且发挥了极大的作用,提高了识别准确度。传统神经网络起源于 20 世纪七八十年代,当时流行的有感知机、bp 算法等浅层网络,随后九十年代提出的 svm 效果更好,同期出现了诸如 adaboost、随机森林、lr 等浅层神经网络,但这些网络由于很难处理梯度消失等训练问题,神经网络发展出现了低迷的时期。直到 2006 hinton
2. 研究的基本内容与方案
主要研究内容和目标如下:
学习有关知识,深入了解行为识别和深度学习的原理和方法,python
软件的编程方法,基于深度学习和TensorFlow设计和优化模型实现对坐、站、行走、躺、上楼、下楼六种行为模式的正确识别,并对识别效果结果进行评价。
拟采用的技术方案及措施:
(1)学习深度学习和行为识别的理论知识,充分检索相关的国内外研究文献资料,了解目前应用于人体动作行为识别的常用深度学习框架、人工神经网络结构、数据集。
(2)确定数据集,了解数据集数据的获取方法和途径,数据的预处理方法和数据的结构。
(3)分类模型的比较和选型。根据数据有前后时间关系的特点,需采用 RNN神经网络,比较多种RNN神经网络的优缺点,确定LSTM神经网络作为本课题的模型。
(4)进行模型的构建和软件实现,根据要求进行数据格式的修正。
(5)将训练集数据送入神经网络,对网络进行训练,训练好的神经网络对测试集数据进行分类,实现六种不同人体动作行为的识别
(6)根据识别结果,对神经网络进行优化,提高模型的鲁棒性和分类精确度。
(7)进行研究工作的总结。分析本课题设计模型的优缺点,提出后续可以改善的地方和作进一步研究的方向。
人体动作识别的流程见图2.1.
| |
| |
图2.1 人体动作识别流程
3. 研究计划与安排
第1-2周:查阅相关文献资料,明确研究内容,了解研究所需的相关知识。确定方案,完成开题报告。
第3-6周:完成英语论文翻译和熟悉原理、方法和软件。
第7-9周:完成模型设计。
4. 参考文献(12篇以上)
[1]shouqiang liu,mengjing yu,miao li,qingzhen xu. the research of virtual face based on deep convolutional generative adversarial networks using tensorflow[j]. physica a: statistical mechanics and its applications,2019,521.
[2] mduduzi manana, chunling tu, pius adewale owolawi. a survey on vehicle detection based on convolution neural networks. [c] 2017 3rd ieee international conference on computer and communications.
[3] gross t, blasius b. adaptive coevolutionary networks: a review[j]. journal of the royal society interface, 2008, 5:259–271.