基于字典学习的行人重识别算法设计研究文献综述
2020-05-04 21:17:27
一、目的及意义
视频监控系统的发展和普及给公安机关侦查破案带来了巨大的变革,但是在实际视频侦查工作中需要耗费大量的人力和时间。行人重识别,即运用计算机视觉、机器学习方法判断某个摄像头中的某个行人是否曾经出现在其他的摄像头中的技术,它可以有效帮助侦查人员在海量视频中发现、追踪嫌疑目标,进而提高公安机关破案率,具有重要意义。但是,行人重识别的研究具有其特殊性,相对于通用图像检索,在实际视频监控中,行人对象的画面质量较差、分辨率较低,而且还存在明显的视角、光照变化。行人姿势的变化等也对行人重识别问题产生很大影响,在不同监控摄像头中,不同行人对象的图像视觉特征可能比同一个行人对象的视觉特征更相似。
二、国内外的研究现状分析
行人重识别的技术流程主要分为三个环节,即行人表达、距离度量、排序优化。
(1) 行人表达方向有利用行人对象上下不对称性和左右对称性提出进行多特征累积[12]、组合多种颜色、纹理特征来表示行人,通过学习给予每个行人不同特征不同的权重等研究。
(2) 距离度量方向有学习 SVM 分类器让同一人的不同样本距离更小、利用深度学习构造距离度量模型、把行人分成多个区域不同区域用不同距离度量函数等研究。
(3) 排序优化方向有通过人工交互,针对现正样本极其稀少,全局相似负样本同样稀少但局部相似负样本很丰富的的特点,应用基于局部交互和组合优化的重排序方法[10]、依据k互逆编码,计算杰卡德距离并与初始排序的马氏距离进行结合等研究[13]。
除了在限定条件下提升行人重识别效果,也有研究开始重视实际视频监控中的一些问题,如分辨率问题、遮挡问题、光照问题、视角问题、训练样本少、训练集与测试集分布不同问题。
(1) 针对多低分辨率问题,扩展分辨率维度,基于多维度表达形成尺度渐变曲线,用随机森林方法和参数向量来学习分类面[8]、半耦合字典学习将低清图像转变为高清图像[15]等研究。
(2) 针对训练集合测试集分布不同,发现跨域支撑一致性和跨域投影一致性设计考虑行人个体特性的距离度量函数[9]等研究。