面向视频动作分类的目标关系网络研究任务书
2020-02-18 17:22:10
1. 毕业设计(论文)主要内容:
动作识别的主要目标是判断一段视频中人的行为的类别,人与物体之间的交互动作则是更复杂具体的动作类别。在本课题中,核心思想是人或物体实例的外观包含指示线索,利用这些信息可以注意到图像中可以促进交互预测的部分。同时掌握视频特征提取方法,三维卷积神经网络的基本原理与方法。在Something-Something数据集上使用卷积神经网络来提取视频特征,通过现有的目标检测网络提取目标对象,将视频特征细化到目标对象上,最终通过目标对象间关系的建模实现动作分类。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇)。
(2)完成开题报告及任务书。
(3)了解学习卷积神经网络在基于视频序列的动作识别中的基本原理和方法,并简单了解目标检测的基本方法,通过现有的目标检测网络提取视频帧中的目标,对目标间的关系进行建模,从而完成动作识别任务。
3. 毕业设计(论文)完成任务的计划与安排
(1)第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
(2)第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。
(3)第7-9周:对整个网络框架进行建模和理论层面的分析。
4. 主要参考文献
[1] hu h, gu j, zhang z, et al. relation networksfor object detection[c]//computer vision and pattern recognition (cvpr). 2018,2(3).
[2] ma c y, kadav a, melvin i, et al. attend andinteract: higher-order object interactions for video understanding[c]. computervision and pattern recognition (cvpr). 2018,3(5).
[3] wang x,gupta a. videos as space-time region graphs[j]. arxiv preprintarxiv:1806.01810, 2018.