HEVC的核心变换及其性能分析毕业论文
2021-04-24 20:10:46
摘 要
面对不断发展完善的多媒体通信技术,以及以视频功能为核心的数字移动终端,HEVC标准正在逐步取代H.264/AVC,成为当前主流的视频编解码标准。为了应对日益增长的视频服务需求,国内外学者们对HEVC编码中的各个关键技术进行了深入研究,并将其拓展到了更广泛的应用领域中。对于视频传输领域,由于高清视频文件普遍较大,服务器端和客户终端都对HEVC的编码性能提出了更高的要求,例如:更低的时间延迟,更低的失真和误码率等。因此,对HEVC压缩编码算法的优化成为目前亟待解决的问题。
绝对大部分视频图像中,都含有较多的平坦区域和场景内容变化缓慢的区域,为了去除空域冗余,可使用变换来使图像能量在空间域的分散分布转为在变换域的相对集中分布。变换编码是视频压缩中非常重要的环节,本设计重点研究HEVC的核心变换并对其进行性能分析。
本设计将从线性DCT出发,导出HEVC的核心变换矩阵,综合分析线性DCT和核心变换的压缩性能和计算复杂度,并用MATLAB仿真验证。
关键词:视频编码,HEVC,核心变换,离散余弦变换(DCT),MATLAB
Abstract
In the face of continuously developing and improving multimedia communication technologies and digital mobile terminals with video functions as the core, the HEVC standard is gradually replacing H.264/AVC, becoming the current mainstream video encoding and decoding standard. In response to the increasing demand for video services, domestic and foreign scholars have conducted in-depth research on key technologies in HEVC coding and extended it to a wider range of applications. For the field of video transmission, due to the generally large size of high-definition video files, server-side and client-side terminals have imposed higher requirements on the coding performance of HEVC, such as lower time delay, lower distortion, and bit error rate. Therefore, the optimization of the HEVC compression coding algorithm has become an urgent problem to be solved.
Since most of the absolute images contain more flat areas and areas with slow content changes, the use of transformation can make the scattered distribution of image energy in the spatial domain become relatively concentrated in the transform domain, in order to achieve the purpose of removing the spatial redundancy. Transform coding is a very important part of video compression. This design focuses on HEVC core transformation and performance analysis.
This design starts from the linear DCT and derives the core transform matrix of HEVC, comprehensively analyzes the compression performance and computational complexity of the linear DCT and the core transform, and uses MATLAB simulation to verify.
Key Words: Core Transformation,Discrete Cosine Transform (DCT),HEVC,MATLAB,Video Coding
目 录
1 绪论 1
1.1 视频编码 1
1.2 视频编解码标准的发展 1
1.3 本文的章节安排 3
2 HEVC标准简介 4
2.1 HEVC编码器结构 4
2.2 图像分割 4
2.2.1 编码树单元(CTU)与编码树块(CTB) 5
2.2.2 编码单元(CU)与编码块(CB) 5
2.2.3 预测单元(PU)与预测块(PB) 6
2.2.4 变换单元(TU)与变换块(TB) 6
2.2.5 CTU、CU、PU和TU的关系 6
2.3 帧内预测 6
2.4 帧间预测 7
2.5 运动估计 8
2.6 残差编码 8
2.7 去块效应滤波器 9
3 HEVC的核心变换 10
3.1 离散余弦变换(DCT) 10
3.2 核心变换矩阵的推导 11
3.2.1 线性DCT矩阵的推导 11
3.2.2 整数DCT变换的优势 13
3.2.3 核心变换矩阵的导出 13
4 核心变换的性能分析 16
4.1 线性DCT变换和核心变换的性能对比 16
4.2 核心变换的快速算法 17
5 变换编码的仿真测试 22
5.1 对静止图像的变换与仿真 22
5.2 对视频的变换与仿真 23
6 总结与展望 27
6.1 总结 27
6.2 展望 27
参考文献 29
致 谢 30
附 录 31
1 绪论
1.1 视频编码
迈入21世纪以来,随着互联网的普及与信息技术的发展,信息的传播速度日益加快,人们所获得的信息数据已经由原来的单一种类的文字型信息转化为信息量更加丰富的多媒体数据。数字视频这一信息时代的代表性产物,正在逐步地渗透到人类生活中的各个角落。
视频这种多媒体形式直观可感,是人们最为喜爱的多媒体类型之一。生活中,人们看电视,看电影,与亲朋好友视频聊天,几乎每一天都离不开数字视频;对于我们高校学生,更是会经常通过在网上寻找相关课程的教学视频来获取知识,提升自我。通过观看一段视频,人们可以获得比文字和语音更多的信息量。但是,视频的数据量是非常之大的,例如,对于一段10分钟的CIF格式视频,如果不进行编码压缩,它的数据量可以达到600秒×30帧/秒×352×288×1.5字节/像素=2737152000字节=2.55G字节。显然,如此大量的数据会浪费有限的存储容量和信道传输带宽,对存储空间与传输时间都是极大的挑战。正因如此,从上世纪末开始,相关领域的专家就开始研发视频压缩编解码技术,在保证视频质量的前提下,尽量去减少传输与存储时所需的数据量,以满足实际应用需求。
一般而言,无论是静止图像还是视频都含有极强的相关性,即数据含中有大量的冗余信息。其中,冗余信息有两种类型,分别是空域冗余信息和时域冗余信息。视频压缩技术的目的是去除数据中的冗余信息,具体而言,压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。时域冗余信息可使用帧间编码技术来去除,帧间编码包括运动补偿、运动表示和运动估计。空域冗余信息则可使用帧内编码技术和熵编码技术来去除 ,帧内编码包括变换编码和量化编码。绝大部分图像中都含有较多的平坦区域和场景内容变化较为缓慢的区域,使用变换可以使图像能量在空间域的分散分布转为在变换域的相对集中分布,从而去除空域冗余信息。由此可见,通过合理地选择视频压缩编解码技术可以有效地消除视频信号中的各种冗余信息,提高传输与存储的效率。
1.2 视频编解码标准的发展
自20世纪90年代初以来,视频编码标准的发展受到两个并行应用空间的驱动:实时视频通信和视频内容的分发或广播。国际电信联盟ITU(International Telecommunications Union)和国际标准化组织/国际电工委员会ISO/IEC(International Organization for Standardization and International Electrotechnical Commission)这两个主要标准化机构一直致力于视频编码标准的制定与研究,推出了一系列视频编解码的国际标准。
图1.1显示了ITU和ISO/IEC这两个标准化组织随着时间发展发布的主要视频编解码标准[1]。可以看出,虽然这两个标准化组织开始时的研究是各自独立的,但它们正在开展越来越密切的合作,特别是为了实现视频编码技术的里程碑——AVC和HEVC,这两个国际标准化组织进行了大量的合作。
图1.1 由ITU-T和ISO/IEC公布的视频编码规范时间线
1984年,第一个数字视频编码标准H.120被ITU-T发布,它专为标准电视(SD)上的视频会议应用而设计,比特率约为1.5-2 Mbit/s,但没有得到广泛的应用。 1988年,ITU-T提出了H.261,该方案旨在通过ISDN在40 kbit/s-2 Mbit/s范围内运行。与H.120相比,它提供了更高的压缩效率和广泛扩展的所支持的比特率范围。针对国际视频会议应用,该方案在通用中间格式(CIF)的视频上进行操作,该格式相对于SD提供了缩小的图片尺寸,以便与不同的国际标准电视分辨率兼容。H.261是第一个基于混合视频编码方案的视频编码标准。它已经包含了所有后续视频编码标准的基本构建模块。
在ITU-T部署H.261的同时,ISO/IEC的移动图像专家组(MPEG)开始制定视频分配和广播的视频编码标准。1993年,MPEG-1视频编码标准被提出。在之后的1995年,ITU和ISO/IEC联合开发的MPEG-2/H.262诞生。在1996年,ITU-T发布的H.263被认为是向现代编码标准特别是连续视频编码迈出的一大步。与此同时,MPEG-4标准制定工作开始展开,该标准旨在规定通用集成多媒体标准,并且引入了如3D图像以及互动图像之类的新概念,其目标是相较于之前的编码标准提高两倍数据压缩率。作为一个新概念,它进一步支持任意形状的对象和合成内容的编码。
2001年12月,ISO/IEC与ITU-T建立了联合工作组(JVT,Joint Video Team),在2003年3月推出了H.264/AVC。H.264/AVC首次提出了宏块的概念,采用了最新的运动补偿技术,并在解码端增加了去块效应滤波器,众多当时最新技术的应用令H.264/AVC标准的压缩效率大大提高,同时还促进了x264等编码工具的推广,使得H.264标准迅速地普及,广泛地应用于网络传输,视频监控等领域。
近几年,对于高清晰度、高帧率的视频格式的需求迅猛增长,对此,ITU-T与ISO/IEC再次展开了合作,在2013年推出了面向高清视频编码的新一代视频编解码标准,并将其命名为高效率视频编码(High Efficiency Video Coding,HEVC),由于HEVC标准采用的是最新的编码技术,因此带来较高的编码运算复杂度[2]。目前该领域内许多学者正在加紧对HEVC标准进行改进与增补完善,提出了许多行之有效的改进措施。
1.3 本文的章节安排
第1章为绪论,介绍了数字视频的发展、视频压缩编码的目的以及视频编解码标准的发展历程。
第2章为总述,总体上介绍了HEVC的编码器结构以及编码器各结构模块的功能,包括帧内预测、帧间预测、运动估计、残差编码、去块效应滤波和熵编码等。
第3章是本论文的重要章节,在数学上利用线性DCT推导出了尺寸为8×8的线性DCT矩阵,并且利用MATLAB编程求出了8×8的整数DCT矩阵。之后,比较了线性DCT矩阵和核心变换矩阵的压缩性能。
第4章主要分析了线性DCT变换和核心变换的计算复杂度,推导了核心变换的快速算法,并画出了8点核心变换快速算法的运算蝶形图,比较分析了核心变换相对于线性DCT变换的优势和劣势。
第5章分别对HEVC编码端的变换编码和解码端的解码重建过程进行了模拟仿真,得到了线性DCT变换和核心变换这两种不同编码方式的重建图像,并对比了两种变换方式的运算时间。
第6章是对本论文的总结,也记录了本人在做毕业设计过程中遇到的问题与解决办法,总结了我在这个过程中的心得与收获。
2 HEVC标准简介
2.1 HEVC编码器结构
HEVC编码框架与H.26X标准的编码框架相类似,均采用基于块的混合模型。与上一代标准H.264/AVC相比,主要区别是:HEVC采用了灵活的四叉树型划分结构,支持多种不同尺寸的预测块、变换块和编码块;对帧内预测技术的模式选择种类与方向进行了大幅改进,并对HEVC编码器的环路滤波器性能进行了优化。这些新技术的应用使HEVC的编码效率得到了大幅提高。HEVC编码框架如图2.1所示[3]。
输入视频图像