基于Tensorflow的Faster R-CNN目标检测算法设计开题报告
2020-02-18 16:22:03
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
视觉是人类最重要的感知系统,是人类获取信息最重要的渠道。在当前信息化时代的背景之下,计算机如何辅助人类完成视觉任务,解决人类在进行场景内目标信息的采集和处理任务时的不足,是人类一直探索的方向,计算机视觉也因此成为当今社会的研究热点。
目标检测作为计算机视觉领域的核心问题之一,学术界已有将近二十年的研究历史,其主要任务是找出图像或视频序列中感兴趣的物体,确定其类别、位置和边框范围。目标检测的实现综合运用了图像处理、机器学习、深度学习和人工智能等技术,有广泛的应用前景。
2. 研究的基本内容与方案
2.1 研究的基本内容和目标
本课题拟实现一种深度学习算法,利用现有深度学习框架,在公开数据集上完成对特定图像的目标检测,找出图像中感兴趣的物体,确定其类别、位置和边框范围。在学习研究深度学习和faster r-cnn的基本原理的基础上,熟练运用相关知识完成基于tensorflow
框架相应网络的设计,训练基于coco数据集的faster r-cnn神经网络,并实现图像中特定目标的检测。
3. 研究计划与安排
(1)第1-4周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
(2)第5-6周:熟悉掌握基本理论,完成英文资料的翻译,熟悉相关工具软件的使用。
(3)第7-9周: 实现faster r-cnn神经网络的设计与实现
4. 参考文献(12篇以上)
[1] jiang h, learned-miller e. face detection with the faster r-cnn[c]. ieee international conference on automatic face amp; gesture recognition. 2017.
[2] ren s, he k, girshick r, et al. faster r-cnn: towards real-time object detection with region proposal networks[c]. international conference on neural information processing systems. 2015.
[3]he k,zhang x,ren s,et al. spatial pyramid pooling in deep convolutional networks for visual recognition[c]. european conference on computer vision.springer,cham,2014:346-361