一种基于生物视觉感知的场景提取算法的设计开题报告
2020-04-12 16:15:19
1. 研究目的与意义(文献综述)
国内外研究现状分析:
目前,基于生物视觉的场景识别技术在理论和技术方面都存在一定的问题,目前还无法实际应用,机器视觉的感知水平还远远落后于人类视觉感知能力。让机器具备人类视觉那样高效的目标检测与识别能力,是国内外研究者们孜孜以求的奋斗目标,其重要的研究意义和广阔的应用前景也激发了学者们对人类视觉感知系统和感知机制进行探索的兴趣和决心。近年来,大量的目标检测与识别算法被提出,在相应应用领域初见成效,一定程度上提高了机器视觉感知的智能化水平,但是与人类视觉系统相媲美的机器视觉感知系统尚未被设计出。
基于生物视觉机制的场景识别主要从五个方面展开研究,这五个方面分别是视觉显著性检测、基于颜色恒常性计算模型的图像增强、显著区域监测与分类、局部特征提取及分类算法,国内外研究者在这些方面都有了一定的成果。视觉注意力选择机制的计算机模型可以追溯到1980年treisman和gelade提出的用于解释视觉注意的特征整合理论(fit),该理论为之后的计算模型提供了基础,这些模型大体上可以分为两类,第一类是基于特征空间分布的模型,第二类则是基于图像频域能量分析的方法,这些模型均在fit理论框架下采用了基于刺激信号驱动的自底向上的机制,具有较强的多尺度分析能力,对不同的环境和任务的适应能力较强。目前颜色恒常理论方面的主要贡献有:1971年edwinland提出来视网膜皮层理论,在1986年提出了基于中心环绕的retinex算法,该算法计算简单且关键参数无需人工干预,2003年kimmel等人提出了变分框架下的retinex算法,进而提高了图像的增强效果。对于区域监测与分割,其中一个关键问题在于如何快速而准确地找到场景中的代表性区域,目前基于这种思路的方法可以大致的分为有监督和无监督学习两类,其中无监督学习方法大多是建立在注意力选择机制的基础上,而在有监督的学习中,显著建筑物检测有助于实现室外场景分析。近年来,基于局部不变量描述符的方法作为场景内容被成功地应用于场景识别与分类。由于区域分割以及局部不变特征在目标识别过程中体现出良好的特征,很多研究者致力于提取基于局部特征的视觉单词,并通过这些单词来对图像进行表征,进而利用语义分析的方法是想场景的分类识别。
2. 研究的基本内容与方案
基本内容:通过研究人的视觉系统的注意力选择机制和显著性检测模型的原理,模拟人的视觉感知能力,设计一种基于生物视觉感知的图像场景特征提取算法,
目标:用于解决复杂背景环境下的图像识别和理解时遇到的难题,目标是实现场景分类,对场景特征实现准确有效的提取,把图形场景分到有语义的场景分类中。
拟采取的技术方案及措施:本次毕业设计通过多特征融合、单元最小化区域生长和分块矩形直方图组合等步骤实现场景特征的提取,通过svm对特征向量进行无监督分类,来指导场景分类。采用亮度、颜色和方向作为场景特征,通过视觉注意模型来得到融合三个场景特征的多特征融合显著图,然后采用一种单元最小化的区域生长方法来对融合后的显著图进行视觉显著区分割,可以避免消耗大量计算时间,每个显著图分割成若干个矩形显著区域,并以最小矩形外接框的形式储存,以便于显著区域特征的提取,利用分块矩形直方图向量来表示区域特征,通过svm但对这些区域特征进行无监督分类来实现显著区域分配。
3. 研究计划与安排
第1-3周:根据设计要求,查阅文献资料,了解相关原理,制定技术方案和措施,完成开题报告。
第4-5周:翻译外文文献,并了解目前常用的几种场景识别方法及其应用领域。
第6-7周:了解生物视觉系统,熟悉相关计算模型,设计基于生物视觉特征的场景分类框架。
4. 参考文献(12篇以上)
[1]基于视觉感知特性的图像检索研究[d]. 沈云涛.西北工业大学 2005
[2]视觉感知计算模型若干问题的研究及其应用[d]. 于江波.北京交通大学 2007
[3]生物视觉感知启发下的目标检测与识别技术研究[d]. 李彦胜.华中科技大学 2015