基于深度学习的图像理解技术研究任务书
2020-03-26 14:50:10
1. 毕业设计(论文)主要内容:
图像理解就是对图像的语义理解,是以图像为对象,知识为核心研究图像中有什么目标,目标之间有什么关系以及图像的背景是什么。CNN RNN是一种非常好的框架,它可以很好的捕捉到图像的特征,同时也可以把图像中的特征相互关联起来,生成自然语言描述。本次研究主要是利用CNN卷积神经网络对图像特征进行提取,然后输入到RNN循环神经网络的隐层状态中来生成自然语言描述。通过和人类手工标记的结果对比,利用BLEU或NIST等对结果进行评估。在Matlab或者python中完成仿真并分析结果。
2. 毕业设计(论文)主要任务及要求
(1)查阅相关文献资料15篇以上(其中近5年外文文献不少于3篇),了解本研究领域的基本理论、关键技术与研究现状。
(2)完成开题报告。
(3)通过预训练好的CNN模型对图像提取特征,将图像特征输入到RNN隐层,对应的文本描述作为数据集训练模型, 利用机器翻译的评价指标BLEU以及NIST对预测结果做分析.
(4)完成不少于12000字的论文的撰写并完成答辩的相关工作。
(5)正文应包含不少于12幅图(包括:电路原理图、流程图、结构框图、程序框图等)。
(6)完成不低于5000汉字(20000英文印刷符)的教师指定的相关文献的英译汉翻译。
3. 毕业设计(论文)完成任务的计划与安排
1、第1-3周:查阅相关文献资料,明确研究内容,学习毕业设计研究内容所需理论的基础。确定毕业设计方案,完成开题报告。
2、第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
3、第6-9周:编程实现各算法,并进行仿真调试。
4. 主要参考文献
1.章毓晋。图像理解(中册)。清华大学出版社.2012.
2.陈桂明,张明照,戚红雨.应用matlab语言处理数字信号与数字图像.科学出版社, 2000
3.刘卓夫,罗中明,赵东阳,贾欣怡,郭明,苏婷。机器视觉技术实现缺损qr条形码识别。