基于特征点匹配的动漫场景图像拼接设计与实现毕业论文
2021-04-19 01:17:13
摘 要
随着科技的发展,时代的进步,对于图像处理的需求也越来越多,同时对于各种图像处理的技术要求也越来越高。而图像拼接作为图像处理技术中的一种,对于图像拼接的研究也一直是该领域的研究热点。同时,图像拼接技术也应用于生活中的各个方面,比如遥感图像,无人机拍摄,虚拟现实,等等。而所谓的图像拼接技术就是指将两幅或者多幅具有重叠部分的图像,通过对重叠部分进行特征点提取,图像配准,再融合拼接成一幅包含全部图像的信息的完整图像。本文的主要目标是运用SIFT算法和Harris算法实现两张动漫图片的拼接,完成全景动漫的实现。本文的主要研究内容如下:
(1)本文首先是阐述了当前图像拼接的研究背景,发展概况等,同时也阐明了本次研究的目标,以及自己的开发环境。
(2)总结分析了图像拼接中预处理、图像配准、图像变换、图像插值与融合等个阶段的相关理论。同时详细分析了本次课程设计的核心算法SIFT算法的特征点检测方法。
(3)对待拼接图像实现了直方图均衡化,对预处理后的图像通过SIFT算法和Harris算法进行了特征点提取,实现图像配准,然后对图像进行刚性变换,用双线性插值以及直接平均融合实现图像的插值与融合,完成图像拼接。对拼接结果进行了结构相似度SSIM和峰值信噪比PSNR进行了质量评价。
(4)完成了基于Matlab GUI图像拼接平台的设计。
关键词:图像拼接;SIFT算法;动漫场景;图像融合;特征匹配
Abstract
With the development of science and technology and the advancement of the times, the demand for image processing is also increasing. At the same time, the technical requirements for various image processing are also increasing. Image mosaic is one of the image processing technologies. Research on image mosaic has always been a research hotspot in this field. At the same time, image splicing technology is also applied to all aspects of life, such as remote sensing images, drone shooting, virtual reality, and so on. The so-called image splicing technology refers to two or more images with overlapping parts, through the extraction of feature points of the overlapping parts, image registration, and re-fusion splicing into a complete image containing the information of all the images. The main goal of this paper is to use SIFT algorithm and Harris algorithm to achieve the stitching of two anime pictures and complete the realization of panoramic animation. The main research content of this paper is as follows:
(1) This article first elaborated the current research background and development profile of image mosaic. At the same time, it also clarified the objectives of this study and its own development environment.
(2) The related theories of image preprocessing, image registration, image transformation, image interpolation and fusion are summarized and analyzed. At the same time, the feature point detection method of core algorithm SIFT algorithm designed in this course is analyzed in detail.
(3) The histogram equalization is performed on the stitched images, and the preprocessed images are extracted by the SIFT algorithm and the Harris algorithm to achieve image registration, and then the image is rigidly transformed, using bilinear interpolation and direct The average fusion realizes the interpolation and fusion of images and completes the image mosaic. Structural similarity SSIM and peak signal-to-noise ratio PSNR were evaluated for the quality of the mosaic results.
(4) The design of the splicing platform based on the Matlab GUI image is completed.
Keywords: Image stitching; SIFT algorithm; Anime scene; Image fusion; Feature matching
目 录
第1章 绪 论 1
1.1课题研究的目的及意义 1
1.2图像拼接的发展与研究现状 1
1.3本文研究的主要内容 3
第2章 基于特征点的图像拼接相关理论 4
2.1图像拼接相关理论 4
2.1.1图像拼接流程 4
2.1.2图像预处理相关理论 4
2.1.3图像配准相关理论 5
2.1.4图像变换相关理论 5
2.1.5图像插值与融合相关理论 7
2.2SIFT特征点提取 8
2.2.1尺度空间极值检测 9
2.2.2关键点精确定位 11
2.2.3关键点方向分配 13
2.2.4关键点特征描述 13
2.3本章小结 13
第3章 图像拼接技术在动漫场景中的应用 14
3.1动漫场景图像预处理 14
3.2基于图像特征的图像配准 15
3.2.1基于SIFT算法的图像配准 15
3.2.2基于Harris算法的图像配准 16
3.3图像仿射变换 17
3.4图像插值与融合 17
3.5实验结果分析 18
3.6本章小结 21
第4章 基于Matlab GUI的图像拼接平台设计 22
4.1GUI图像拼接平台的总体布局设计 22
4.2GUI图像拼接平台的实现 23
4.3本章小结 26
第5章 总结与展望 27
5.1论文工作总结 27
5.2未来工作展望 28
参考文献 29
致谢 31
第1章 绪 论
1.1课题研究的目的及意义
在自然社会中,人类都是通过眼睛来进行感知和认识,通过眼睛来获取信息,在日常生活中,人们离不开眼睛的作用。然而人类眼睛的视野角度是有最大限度的,而这个最大限度被称为人眼视度。通常,人类的双眼获取视野的最大角度仅仅是188度,所以,人们通过眼睛获取外界信息是不全面的、不完整的,是十分有限的[1]。而就目前来看,人们对于获取全景图像的技术主要是以下两种情况:
第一种方法即使通过全景摄像机和全景摄影技术来进行拍摄,获取全景图像[2]。该摄影技术是通过大视场的摄影机进行全景拍摄,一次性获取全景图像,但与此同时,使用该方法的缺点就是所拍摄的全景图像与人们的视觉感受不相符,所拍摄的图像呈现出中间清晰,而图像边缘位置的内容则呈现出不同程度的扭曲和形变的特点,存在着景物失真。同时这种全景拍摄技术在获得了较大视野的同时,图像的分辨率也会因此降低。并且这进行大视场的拍摄的全景摄像机加个昂贵,使用复杂,所以受用率较低,也不利于普及。
第二种能够获取全景图像的方法就是通过软件来实现的,同时这也就是本文将要着重研究的图像拼接技术[3]。这种方法与上述的全景摄影技术相比,普及率高、价格低、操作也更简单,同时所获得的图像不仅在分辨率上比第一张方法获取的全景图像更高,也满足了获得更大视野的特点,更符合人们的视觉邀要求,并且在日常生活中,也满足了人们在既需要较高分辨率也需要较大视野的图像要求,例如:在航空领域,对于卫星图片的获取,这种图像并不能通过普通的摄像设备或者全景相机来获取。又例如:在一般的动漫中,如果想要充分的展示出一个场景的特点,那么必须要通过多个镜头来展现,并不能直接通过一个镜头来直接展示。因为,对于一般的摄影设备而言,如果想要获取较高的分辨率,那么必然的图像视野就会下降,反之,如果想获取较高的视野,那么分辨率就必然会降低。