亚像素精度运动估计算法的实现毕业论文
2021-03-15 19:58:50
摘 要
视频图像帧间预测编码能够充分利用序列图像在时间轴方向上的相关性进行压缩编码,可达到较高的压缩比。可以说,运动估计技术目前已经成为帧间预测编码的核心技术,也是提高编码效率的主要途径。实现快速高效的亚像素级精度的运动估计一直是当今信息与通信工程学科的研究热点之一。
本论文在介绍了亚像素运动估计技术的应用背景及意义后并分析了国内外现状的基础上,首先简要概括了帧间预测编码中运动估计的基本原理,然后详细讨论了典型的运动估计算法和不同精度级别下的亚像素运动估计。接下来本文提出了一种高效的互相关亚像素运动估计算法,通过快速傅里叶变换(FFT)运算参考图像与位移图像间的上采样互相关曲面,获得初步估计的互相关峰值,然后在该峰值的一个小范围内采用矩阵相乘的离散傅里叶变换(DFT)进行上采样DFT来精确运动矢量值。最后在实验结果的依据下总结了该算法的优缺点及适用范围并对还需继续研究的问题进行展望。
关键词:运动估计;亚像素;上采样;互相关;离散傅里叶变换
Abstract
Video image interframe prediction coding can make full use of the correlation of image sequences on the time axis to compress coding , which can achieve a higher compression ratio. At present,motion estimation technology,as it were,has become the core of the Interframe prediction coding technology and is also the main way to improve the coding efficiency. To achieve fast and efficient of the pixel accuracy motion estimation has been one of research hot spot in today's information and communications engineering disciplines.
This paper is on the basis of introducing application background and significance of the subpixel motion estimation technology and analyzing the status quo at home and abroad. Firstly,the paper summarizes the basic principle of motion estimation in the interframe predictive coding briefly and then detailedly discusses typical motion estimation algorithms and sub-pixel motion estimation under different accuracy level. Next, this paper proposes an efficient cross-correlation subpixel motion estimation algorithm that computes the upsampling surface on the cross-correlation between the reference images and the shifted image by fast Fourier transform, to obtain an initial estimate of the crosscorrelation peak.It refines the shift estimation by upsampling the DFT only in a small neighborhood of that peak by means of a matrix-multiply DFT. Finally, the paper summarizes the advantages and disadvantages and applicable scope of this algorithm based on the results of experiments, meanwhile, points out problems which still need continue to study.
Key Words:Motion Estimation; Subpixel; Upsampling; Crosscorrelation; Discrete Fourier Transform;
目录
1绪论 1
1.1课题研究的目的与意义 1
1.2国内外研究现状 1
1.3课题研究内容 2
1.3.1亚像素运动估计的主要内容 2
1.3.2采用的主要技术方案 3
1.4预期目标 3
2亚像素运动估计原理 4
2.1运动估计的理论基础 4
2.1.1帧间预测编码 4
2.1.2二维运动估计 5
2.2典型运动估计算法 6
2.2.1像素场的运动估计——像素递归法 6
2.2.2块运动场的运动估计——块匹配法 7
2.2.3分级块匹配运动估计 9
2.3亚像素运动估计 10
2.3.1运动估计精度 10
2.3.2精度的亚像素运动估计 11
2.3.3精度1/k亚像素运动估计 12
3实验及其结果 15
3.1算法流程论述 15
3.2仿真实验结果分析 16
4总结与展望 19
4.1工作总结 19
4.2展望 19
参考文献 21
附录 22
致谢 26
1绪论
1.1课题研究的目的与意义
由一帧帧序列图像构成的视频图像,是观察者通过图像传感器等摄像器件对处于运动状态中的客观物体进行观测后成像的结果,比静止图像更能体现真实世界。视频图像的显著优点是信息量大,但庞大的信息量若不经过压缩,显然会超出当前个人计算机对图像的处理和存储能力,另外现有的通信网络带宽下是无法完成大量视频数据实时传输的,因此序列图像的压缩传输在现代图像通信中占据了相当重要的地位。本文课题研究的目的便在于凭借高精度的运动估计技术把原来较大的视频图像用尽量少的字节表示和传输预测误差,并且解码端还原图像时有更好的视觉效果。本质上,图像的运动是图像像素间的几何变换。在相邻帧间的图像中,绝大部分区域像素值是相似甚至相同的,而序列图像的一大特点就是在时间轴上有很大的数据冗余,如果能够削弱运动图像的这种时间冗余,运动图像的数据量就会大幅度降低。目前,运动估计技术是消除时间冗余最基础有效的手段,已经成为运动图像处理中不可或缺的组成部分,也是H.26x系列视频编码标准制定过程中的代表性技术。
近些年来,由国际标准化组织(ISO)、国际电信联盟(ITU)和国际电工委员会(IEC)制定的一系列运动图像编码标准极大地促进了运动图像压缩技术和多媒体通信技术的发展。随之而诞生的可视电话、网络电视、视频监控等产业化应用已经取得了巨大的成功,丰富着人们的娱乐和工作,促进着社会多样化发展。最早出现的H.261标准中使用整像素级精度的块匹配算法进行刻画,会产生较大误差。但当以亚像素级精度来表示时,则能减少传输帧数,因为高精度的运动估计可使预测误差更小。显然如何获取高精度的运动矢量是视频编码中的主要研究问题。对此,H.263标准中则扩充了1/2像素运动估计,较整像素运动估计编码效率提高了1.5dB。2003年5月,H.264标准中则进一步支持1/4像素运动估计,较1/2像素精度编码效率提高了0.6dB。亚像素级精度的运动估计,能够更好地适应复杂运动,得到的残差就越小,压缩比就越高[1]。