登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 电子信息工程 > 正文

室外场景视频拼接方法研究与实现文献综述

 2020-04-14 17:31:05  

1.目的及意义

1.1 研究目的及意义

视频拼接技术经过前人的研究和发展使得视频可以进行拼接,但是视频拼接领域属于较新的研究领域,存在着巨大的研究空间。对视频拼接技术进行深入研究可以使其更好的应用在各个行业和各个领域,为我们的生产生活提供便利。

视频拼接是指将多个监控前端摄像机传过来的视频进行拉伸、切割、合成,去除重合部分,校正变形部分,最后拼接成一幅高分辨率视频图像的功能。

视频拼接不仅适用于大型广场、水库、风景区、火车站台、码头、机场、海滩等比较开阔的场地,还适用于加油站、收费站、超市收银等连续场所,在虚拟现实、视频会议、军事监控、交通导航等领域也有广泛的应用。对于军事方面,无人机侦察利用较多。然而对于开阔的场地单个摄像机无法实现全面覆盖,这可能导致监控操作人员无法快速、及时、正确地做出判断,这就为安防系统埋下隐患。无人机侦察视频图幅较小,可能无法完整呈现有用信息。

动态视频拼接的研究成果可以极大的提高监控效率,可以给普通环境下的中小型监控带来经济高效的效果,不仅如此,视频拼接技术还可以让人们在面对更加复杂的视频背景下完全提取自己所需要的信息,这为我们的生产生活提供了更多的便捷和效率。

1.2 国内外研究现状

目前,拼接形式主要有两种:横向拼接和纵向拼接。横向拼接主要适用于广阔视野的场所,如:广场、风景区、火车站等。纵向拼接主要适用于收费站、加油站等连续场所。

在视频拼接方面,国内外的研究主要表现在视频图像的拼接、视频投影合并等。初期时学者们研究的视频直接处理方法主要有,对视频进行压缩,编解码,调整画面大小和清晰度,对视频进行加减操作,如加入其他视频的画面或者除去原视频的声音等,还有被广泛使用在诸多领域的视频投影合并,而视频投影合并又分为两种,一种是将不同视频内容以一定秩序进行空间上的上下左右合并,使多个不同的画面同时出现,另一种则是将一个视频画面分成许多小块进行投影,以达到对原视频放大的效果。

国内的研究主要有程咏梅等提出SIFT的航拍视频图像镶嵌,该方法首先通过SIFT特征匹配算法检测并描述特征,然后利用双向匹配算法完成拼接,该方法鲁棒性较强,但由于SIFT计算过于复杂,实时性不高。对于郑晖等提出了一种无人机视频帧自动拼接方法,该方法利用透视投影法消除几何形变,然后利用CUDA加速的ORB算法得到帧间变换模型,最后应用LM算法优化单应性矩阵,该方法减小了拍摄带来的误差影像,增强了拼接效果,但拼接执行效率不高。孙世宇等提出改进模型估计的无人机侦察视频快速拼接方法是首先基于自适应鲁棒性尺度不变的特征检测子对视频各帧进行基于点的特征匹配,然后进行模型估计,去除误匹配点,计算单应性矩阵,完成视频拼接。这种方法相对于前面的几种方法而言,提高了执行速度和拼接速度,而且拼接效果得到改善。朱庆辉等提出基于改进SIFT特征描述子的柱面全景图像拼接算法。首先将待拼接的图像序列进行柱面投影,利用改进的SIFT特征检测器获取图像中的特征点,生成64维SIFT特征描述子; 然后根据特征描述子之间的欧氏距离提取初始特征点对,利用RANSAC( random sample consensus)方法进一步剔除伪匹配特征点对并建立待拼接图像之间的空间变换矩阵; 最后根据图像之间的空间变换矩阵进行图像配准,采用加权平均融合的方法完成图像的无缝拼接。这种方法有效地克服平面拼接算法存在的失真问题,保证了全景图像的视觉一致性。同时,相比普通柱面拼接算法,该算法的拼接速度提高了近一倍。杨毅等提出融合图像高阶语义信息的视频拼接方法,这种匹配算法正确率提升了50%左右,拼接评价算法更符合人眼视觉,方法的拼接质量提升了25%左右,具有较高的鲁棒性与准确性。卢旻昊等提出的实时视频快速拼接算法,在建立实时拼接处理系统框架基础上综合运用图像改进区域二值化(LBP)纹理特征与加速健壮特征(SURF),先提取角点作为备选特征点,再采用改进LBP特征对备选特征点进行粗匹配,通过2次筛选降低了计算SURF提取的备选点数量,同时减少了匹配计算的次数和维度。

国外的主要研究有Lin C C等2015年提出自适应图像拼接方法,该方法将图像划分为密集网格,每个网格都计算出一个单应矩阵。并将局部单应性与全局相似性变换组合,根据图像目标自动估计出所有参数。这类方法可以允许一定程度的局部视差,但由于引入网格的形变估计,极大增加了计算成本,拼接一张图需要十几秒甚至几分钟,不能直接应用到视频拼接算法中。Badrinarayananv等2017年提出一种用于图像分割的深度卷积编码器-解码器架构,包含一个编码网络和对应的解码网络,并跟随一个像素级别的分类层。编码层由13个卷积层构成,其作用是提取图像特征,解码器网络将低分辨率的特征图谱还原到输入图像的分辨率,可以处理任意大小的输入图像并输出相同大小的分割图。该架构在城区场景理解方面效果表现明显。Guo H等提出了一种全软件联合方法缝合和稳定由多个移动捕获的摇晃视频相机,从而创建一个放大的稳定视频视角。

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图