基于特征选择和增强Borda计数的局部Gabor人脸识别方法改进外文翻译资料
2021-12-11 21:59:21
英语原文共 13 页
基于特征选择和增强Borda计数的局部Gabor人脸识别方法改进
Claudio A.Perez n, LeonardoA.Cament,LuisE.Castillo
Image Processing Laboratory, Department of Electrical Engineering and Advanced Mining Technology Center, Universidad de Chile, Av. Tupper 2007, Santiago, Chile
摘要
根据年龄和性别,面部识别在选定客户监视,人机界面以及营销和广告商品中具有广泛的可能应用。由于高分类率和显示出超过90%的识别率。EJS-BTH-BIP组合分别在AR数据库的太阳镜和围巾图像中达到98%和99缩短的计算时间,人脸识别的最佳方法之一是基于Gabor喷射特征提取和Borda计数分类。在本文中,我们提出了方法上的改进,通过使用熵和遗传算法选择Gabor喷射来提高人脸识别率。这种喷射选择还允许更快地处理实时面部识别。我们还建议通过加权Borda计数和阈值来改进Borda计数分类,以从投票过程中消除低分数喷射以增加面部识别率。还提出了Gabor喷射选择和Borda计数改进的组合。我们将我们的结果与迄今为止在文献中发表的结果进行了比较,并发现了我们在FERET数据库上的最佳结果分别对子集Fb,Fc,Dup1和Dup2的识别率分别为99.8%,99.5%,89.2%和86.8%。与文献中公布的最佳结果相比,识别错误总数从163减少到112(31%)。我们还在照明变化,太阳镜和围巾的遮挡以及小的姿势变化下测试了所提出的方法。在具有显着照明变化的两个不同面部数据库(AR和扩展耶鲁B)上的结果%的识别率。拟议方法达到93.5%。在FERET数据库中识别具有251个旋转的小姿势变化和98.5%以及15%旋转的面部。
1. 介绍
在世界上大多数大城市,已经安装了数万台用于视频监控的摄像机。在伦敦(英国)地铁系统中,安装了超过13,000台摄像机用于监视[1]。在巴黎(法国)有9500多个[2],在马德里(西班牙)超过6000[3] 在圣地亚哥(智利)800多台相机[4]。大多数大都市区都安装了数千台摄像机,用于监控高速公路,商场,百货商店,机场,火车站,大学校园,学校和市区街道。与大规模部署相机相比,实时监控捕获图像的能力非常有限。
人脸识别技术在特定应用中表现出优于其他生物识别技术的优势,例如“观察名单”。面部识别不需要主体的主动参与,并且可以在远处执行[5]。
此外,在唯一的情况下,可以进行面部识别一个人可获得的信息是一张图片。人脸识别的另一个优点是,每个人都可以注册与指纹识别相比,其中一部分人群没有与生物识别兼容的指纹[6]。面部识别也正在为选择性营销应用以及人机界面开发[7]。
面部识别是主动研究的主题,并且已经提出了几种方法来执行该任务。许多方法都专注于面部和眼睛定位,这是面部识别之前的关键步骤[8–11]。大量论文直接关注人脸识别,假设脸部已经局部化[12,13]。我们将把我们的文献综述集中在已经产生最高人脸识别性能的后一种方法上。特征脸[14]基于主成分分析(PCA),是一种通过线性投影减少面部图像维数的方法,该投影最大化了投影样本之间的色散。费舍尔[15]基于线性判别分析(LDA),它与特征脸类似,但使用线性投影来最大化不同类别之间的距离,并最小化每个类别内的距离。其他人脸识别方法基于离散余弦变换(DCT)[16,17] 和Walsh-Hadamard变换(WHT)[18]。
首先方法比较来自输入和图库图像的基于DCT的特征向量,第二个是使用均方误差(MSE)比较基于WHT的特征向量的低复杂度算法。局部线性判别嵌入(LLDE)[19] 通过使用类转换向量添加比例和平移的不变性来改进局部线性嵌入(LLE)方法。LLE的目的[20,21] 是将高维向量映射到低维向量。另一种人脸识别方法是光谱特征分析(SFA)[22] 它保留了数据的非线性流形结构。SFA是加权核主成分分析(KPCA)的一个特例[23]。动态训练多级聚类(DTMC)[24] 是一种面部识别方法,它使用判别分析来投影面部类,并进行聚类以划分投影数据。为了创建最有用的聚类,使用基于熵的度量。在[25] 基于Hausdorff距离的度量用于将面部图像中的像素的灰度值表示为矢量。发现图像的变换对光照变化不太敏感,并且还保持原始灰度图像的外观。
最近,局部匹配方法和面部表征在面部识别研究中变得流行。提出了局部二值模式(LBP)方法[26]其中,面部图像被分成方形窗口,每当像素超过平均值的平均值时,就生成二进制代码窗口。最佳结果的距离测量值为w2,为97%
Fb FERET集的成功率[27]。Gabor小波[28–31] 已被用于提取局部特征,在人脸识别中取得突出成果。在[32,33] 稀疏表示方法用于面部识别。该方法对于遮挡,噪声,光照变化和变化的姿势是鲁棒的。该方法的另一个重要方面是没有信息丢失,如基于特征提取的方法。
基于Gabor小波进行人脸识别的第一种方法之一是弹性束图匹配(EBGM)方法[34]。EBGM方法使用一组与节点相关联的Gabor喷流,从面部提取局部特征。EBGM在FERET Fb集上达到95%的准确率[27]。Gabor Fisher分类器(GFC)[35] 是一种使用增强型Fisher线性判别模型(EFM)的人脸识别方法[36] 在从Gabor表示图像获得的矢量上。本地Gabor二进制模式(LGBP)运算符是Gabor小波和LBP运算符之间的组合。局部Gabor二值模式直方图序列(LGBPHS)[37] 使用LGBP运算符。通过在非重叠矩形窗口中划分图像,在面部图像上获得40个Gabor滤波器(五个刻度和八个取向)的LGBP图。在每个矩形窗口中计算一系列直方图,并使用直方图交叉和加权直方图交叉将该序列与图库中的序列进行比较 [37]。对于FbET的Fb和Fc组,最佳结果是98%和97%[37]。
一种基于Gabor相位图(HGPP)直方图的方法[38] 使用来自Gabor滤波器特征的相位来计算全局Gabor相位模式(GGPP)和本地Gabor相位模式(LGPP)以及关于像素和附近的全局和局部信息。与LGBPHS类似,图像被分成不重叠的矩形,并且使用直方图交叉的方法和用Fisher分离标准训练的加权直方图交叉来比较特征。在FERET数据库的Fb,Fc,Dup1和Dup2组中获得的结果分别为97。5%,99。5%,79。5%和77。8%[38]。Gabor滤波器也用于称为局部Gabor纹理(LGT)的方法中[39] 其中,基于形成文本词汇的Gabor特征,将图像划分为为每个区域生成聚类的区域。将词汇直方图与使用的库直方图进行比较w2具有Fisher准则权重。LGT的最佳结果是97%Fb集FERET数据库[39]。
人脸识别方法称为学习本地Gabor模式(LLGP)[40] 具有学习阶段,其中每个训练图像由不同尺度和方向的C Gabor滤波器滤波。利用C Gabor功能,执行聚类以生成C代码簿。在识别阶段,LLGP码本应用于获得C LLGP映射的C Gabor特征。这些图被分成非重叠区域,获得产生直方图序列的每个区域的直方图。将该序列与直方图交叉点进行比较,并使用最近邻方法执行最终分类。LL的方法在Fa中达到99%,在Fb中达到99%,在Dup1中达到80%,在FERET数据库中达到78%在Dup2中[40]。
本地Gabor二元模式美白PCA(LGBPWP)[41] 方法基于LGBPHS并用PCA进行美白过程。这是对PCA的改进,因为在高频下组件辨别不会丢失。此外,该方法基于方差选择特征,并且分别在子集Dup1,83。8%和Dup2,81。8%中的FERET人脸数据库上获得一些最佳公布结果。
提出了一种使用具有Gabor特征的3D和2D模型的有趣算法[42]。使用3D模型执行登记,然后使用2D特征提取进行识别,其中Gabor滤波器使用3个比例和8个方向。
使用FERET人脸数据库在文献中公布的最佳人脸识别结果使用局部匹配Gabor方法(LMG)[43]。子集Fb,Fc,Dup1和Dup2的识别率分别为99。5%,99。5%,85。0%和79。5%。利用这种方法,总共使用了4172个Gabor喷射器来提取五种不同空间分辨率的特征(l)。Borda伯爵方法用于比较Gabor喷气机中的内积[43,44] 输入面部图像和Gabor喷嘴之间的画面中的面孔。
Gabor特征选择使用不同的方法进行,包括遗传算法(GA)[46,47]。使用该GA方法,选择Gabor特征的15个最相关坐标,并且适应度函数是识别性能。
在最近发表的Gabor小波人脸识别方法评论中[48],基于Gabor小波的研究进行了比较和排名。LMG具有最高的整体性能[43]。
在本文中,我们提出了LMG方法的几个改进[43] 基于Gabor喷气机选择和Borda计数增强。之前将LMG Borda计数方法与另一种方法进行了比较,该方法结合了面部识别问题的矢量/直方图连接特征[43]。在FERET数据库上测试的Borda计数获得了最好的结果[27]。另外,在Borda计数方法中,每个Gabor射流被认为是特征向量,其使用余弦距离作为相似度量与来自图库的相应Gabor射流进行比较。与Adaboost的情况一样[49,50]每个Gabor射流构成一个弱分类器,并且它们中的大量在Borda计数方法中组合成为一个强大的分类器[44,43]。我们还考虑通过在输入分数中使用权重来修改Borda计数。
我们建议在Borda计数分类器中进行修改[43],Gabor使用熵和GA进行喷射选择,并将喷射加权组合成Borda计数。除了改善人脸识别结果外,Gabor喷射选择还可以更快地处理实时人脸识别。我们还建议通过加权Borda计数和投票阈值来改善Borda计数,以提高面部识别率。还研究了Gabor射流选择和Borda计数改进的组合。所提出的新方法比迄今为止在文献中公布的方法获得了明显更好的结果。我们的结果与最近发表的九篇论文进行了比较。
2. 方法
2.1 本地匹配Gabor用于人脸识别
基于局部匹配的人脸识别Gabor由三个主要模块组成[43]:图像归一化,通过Gabor喷射计算特征提取和使用Borda计数匹配进行分类,如图所示图。1。第一模块通过图像旋转,位移和调整大小来执行面部归一化,以将眼睛定位在固定位置。标准化图像使眼睛固定在203times;251像素图像内的位置(67,125)和(135,125)[43]。第二模块执行Gabor喷射计算以使用眼睛作为参考点从面部提取特征。Gabor喷射是使用放置在面部上的五个网格在选定点上计算的,如图所示图2(a)–(e)。五个网格表示Gabor喷气机在五种不同空间分辨率下提取特征的位置。在通讯中对于网格大小,Gabor小波有五个空间尺度0le;vle; 4英尺。
在网格上的每个点处,Gabor小波在(1)中具有八个不同的方向0 rmr7。图2(a) - (e)用 号表示计算Gabor喷流的位置,并显示白色正方形描绘了5个空间中每一个的Gabor喷射尺寸频率。一架喷气机是一组Gabor特征,用于八个方向,在网格上的一个点处提取。因此,喷射可以用坐标(n,x,y)的长度为8的向量表示。
该方法假定可以使用图库来识别要识别的人的面部。对于画廊中的每个面部,Gabor喷射器离线计算并存储在数据库中以供稍后在线识别。第三模块,Borda计数匹配,在输入面部图像上计算的Gabor喷射器组和存储在库中的每组Gabor喷射器之间进行比较。使用每个Gabor射流之间的内积进行该比较,该射流是在五个网格的每个点处的长度为8的向量。输入面部图像的Gabor喷射和画廊的Gabor喷射之间的内积的结果是Ntimes;M维度的矩阵,其中N是图库中的面部图像的数量,M是喷射的数量。使用Borda计数方法进行最终分类[44] 根据所有喷气机中的投票选择来自画廊的识别出的面部。在Borda计数方法中,所有喷嘴都根据具有库元素的内积结果进行排序。对于尺寸为Ntimes;M的矩阵S的Borda计数过程,其中Sij是第j个Gabor喷气机与第i个图像的比较得分画布。对矩阵S的每个列C进行分类,从而获得具有尺寸为Ntimes;M的分类列O的矩阵,如图所示
O的一列中的每个分量Oij 是来自的分数N - 1到0。最后,第i个gallery元素的完整分数是O的第i列中所有行的总和,以及最终得分
表格1图6示出了6个喷气机和具有4个图像的图库的Borda计数计算分数的示例。画廊图像i3 获得大多数喷气机的最高分和最高分。在P向量中选择秩-1图像得分,即,选择最大得分值作为识别出的面部,进行面部识别。
图1 局部匹配Gabor由三个主要模块组成:图像归一化,通过Gabor喷流计算的特征提取和使用Borda计数匹配的分类
图2 来自FERET数据库的面,具有用于空间尺度的五个网格(a)n = 0,(b)n = 1,(c)n = 2,(d)n = 3和(e)n = 4。符号 表示空间点在计算Gabor小波的网格上。白色方块表示每个空间尺度的Gabor喷气机的尺寸,以(a)25 x 25,(b)37 x 37,(c)51 x 51,(d)71 x 71和(e)101 x为单位。 101。
图3 Borda计数计算方法的图示。(a)尺寸为Ntimes;M的矩阵S,其中Sij 是第j个Gabor射流与第三个图像的比较的得分。(b)具有排序列O的矩阵,其中维度为Ntimes;M,每列中的值为N-1到0。(c)第i个gallery元素的Borda计数分数,作为第i行的O中所有列的总和 lt;
资料编号:[5716]