基于多模式融合的视觉跟踪技术研究开题报告
2020-02-18 16:15:56
1. 研究目的与意义(文献综述)
视觉是人与外界接触的方式之一,大约80%的外界信息来自于视觉。但是人类视觉所带来的东西是有限的(受活动范围以及视野的限制),也是有时效的,所以,计算机视觉应运而生。计算机视觉是在了解人类视觉的基础上,用成像系统代替人类视觉器官,用计算机代替人脑完成对输入图像的处理与理解。随着科学技术的发展,计算机技术也越来越发达,因此,计算机视觉也越来越受到计算机信息、生物、数学等众多领域的重视。
视觉跟踪技术作为计算机视觉领域的热门课题之一,是对连续的图像序列进行运动目标检测、提取特征、分类识别、跟踪滤波、行为识别,以获得目标准确的运动信息参数(如位置、速度等),并对其进行相应的处理分析,实现对目标的行为理解。
视觉跟踪是指对图像序列中的运动目标进行检测、提取、识别和跟踪,获得运动目标的运动参数,如位置、速度、加速度和运动轨迹等,从而进行下一步的处理与分析,实现对运动目标的行为理解,以完成更高一级的检测任务。多模式融合即将基于区域、特征点、主动轮廓的视觉跟踪算法,采用信息融合的方法,综合这些跟踪模式的跟踪结果,实现比单模式更好的跟踪效果,因此具有重要的理论和应用研究价值。
2. 研究的基本内容与方案
基本内容:视觉跟踪是计算机视觉领域中的一个热点问题,其在诸如目标制导、自动驾驶、行为识别等应用场景下有着广泛的应用价值。近年来,尽管人们对于视觉追踪有了广泛的研究,并提出了许多有效的跟踪方法,但对于复杂的现实环境来说,单一的视觉跟踪方法很难满足系统需求,为了提高系统的稳定性和可靠性,论文提出利用基于多模式融合的视觉跟踪技术,从而得到更好的结果。
目标:本论文重点将单模式的跟踪技术,采用信息融合的方法,综合这些模式跟踪的结果,然后进行分析比较,得到比单模式更好的跟踪结果。
3. 研究计划与安排
第1周—第3周 搜集材料,撰写开题报告
第4周—第5周 论文开题
第6周—第12周 深入了解相关专业知识,熟悉matlab软件的运用,编写算法及程序,撰写论文初稿
4. 参考文献(12篇以上)
[1] fang w, zheng l, deng h, et al. real-time motion tracking formobile augmented/virtual reality using adaptive visual-inertial fusion[j].sensors, 2017, 17(5):1-22.
[2] bing b, zhong b, gu o, et al. kernel correlation filters forvisual tracking with adaptive fusion of heterogeneous cues[j]. neurocomputing,2018, 286:s0925231218301012.
[3] 王秀友, 范建中, 刘华明,等. 自适应交互式融合的视觉跟踪[j]. 光学精密工程, 2017(9):2499-2507.