基于TensorFlow的人脸识别卷积神经网络外文翻译资料

2021-12-19 22:01:32

英语原文共 5 页

基于TensorFlow的人脸识别卷积神经网络Liping Yuan，Zhiyi Qu1，Yufeng Zhao1，Hongshuai Zhang，Qing Nian2

1.兰州大学信息科学与工程学院

2.兰州市公安局技术侦察支队

中国兰州

yuanlp15@lzu.edu.cn, quzy@lzu.edu.cn, zhaoyf10@lzu.edu.cn, zhanghsh15@lzu.edu.cn,554506103@qq.com

摘要 - 人脸识别是计算机视觉领域的一个热门研究领域，对特定人物的检测和识别具有很高的实用价值。研究发现，在传统的手动提取特征中，存在姿势，面部表情，光照和遮挡等不受控制的情形，影响识别的准确性，性能较差。因此采用深度学习方法。在人脸检测的基础上，提出了一种基于TensorFlow的卷积神经网络（CNN），这是一种开源深度学习框架，用于人脸识别。实验结果表明，该方法在复杂环境下具有较高的识别精度和较高的鲁棒性。

关键词 - 人脸识别，深度学习，CNN，Tensorflow

Ⅰ.简介

随着信息技术的快速发展，网络为人们带来了极大的便利，人们愿意获取大量的信息。但是，信息的安全性日益严重。网上银行，电子商务以及国家安全等方面应用很多，迫切需要有效的识别技术来保护用户的安全。此外，一些恐怖分子在网络中传播了大量不良信息，给国家的稳定与和谐带来了极大的危害。与传统的身份认证技术相比，基于生物特征识别的身份认证技术更加高效，便捷，安全，既能满足公民的基本安全需求，又能在国家信息安全中发挥至关重要的作用。

目前，生物特征识别技术主要采用计算机视觉，图形和图像处理，模式识别等技术来提取人体特征，包括生理特征和行为特征。可以检测和验证的生理特征是指纹，虹膜，视网膜，面部特征，DNA等，以及声音，步态，手写等行为特征。与指纹和虹膜相比，人脸识别是一种具有更高特性，可接受性和直觉特性的非接触式识别技术。

当人脸识别技术用于获取人脸图像时，没有接触，因此可以用于隐蔽操作，并广泛用于特殊人员监控。它更方便，更容易被用户接受。使用时，可记录被识别的人脸，并用于追踪犯罪分子，人员出勤等，生物特征识别（如指纹，虹膜）无法携带。在人脸识别中，对数码相机，相机等成本逐渐降低的设备的硬件要求不高，因此人脸识别的实际发挥空间非常大。

面部识别也有一些缺点。首先，脸部会随着时间和表情的变化而变化，而化妆，眼镜和其他装饰等一些微小的变化会带来识别错误，造成一些不确定性。其次，虽然每个人的脸都是独一无二的，但仍有两个或两个以上相似的面孔，这会给识别带来一些麻烦。最后，信息采集在识别过程中也是一个难以克服的技术难点，而照明条件，采集角度和采集装置之间的距离会影响采集效果，从而影响识别的准确性。

面对互联网上的大量敏感图像，我们使用图像处理技术来检测和分析它们。与现有的人脸检测和人脸识别算法相比，提出了一种敏感人群识别系统。利用最新的高级学习框架，设计了神经网络模型，实现了有效的人脸识别。对于敏感人士，他们可以使用该系统来选择和识别图像中的大量未知信息。然后协助公安部门有效阻止不良信息的传播，以确保网络信息的安全性和稳定性。

II．相关工作

在人脸检测技术中，常见的人脸检测方法分为基于特征的检测方法和基于统计模型的检测方法。前者较为成熟，但受限于光线，表情，姿势等条件。另外，基于结构特征的检测算法比较大，一般不能满足人们对实时检测的要求。基于统计模型的检测算法是研究方向的主流，在统计过程中使用大量样本进行训练，使得结果具有一定的可靠性。其中，Adaboost算法就是速度最快的检测方法。对状态信息的最清晰描述是基于隐马尔可夫模型（HMM）和纹理特征的算法。在我们的工作中，我们应用Adaboost算法训练级联分类器，以准确、实时地检测和跟踪人脸，这有利于后端人脸识别。

人脸识别技术可以追溯到18世纪，弗朗西斯·高尔顿在“自然”中发表了一篇基于面部信息的文章进行识别。一般来说，根据不同的分类算法，人脸识别可以分为以下几个方向。基于模板的方法，利用图像灰度级和计算机模板之间的相关性来进行人脸识别。该方法基于几何特征，利用几何向量来表示人脸的局部特征和聚类方法来设计分类器。在基于弹性图的方法中，网格用作模板以将图像与网格进行比较。虽然识别性能更好，但计算量大且识别速度慢。基于HMM，将概率估计和面部图像的奇异值特征转换为矢量，并将HMM用于识别。基于主成分分析（PCA）的特征脸方法，利用PCA变换减少原始图像处理，然后进行分类和识别。在基于线性判别分析（LDA）的Fisherface方法中，降低了图像的特征，然后使用LDA在降维后转换和提取主成分的特征。预计大类别间的分歧和小类别内的分歧。局部二值模式（LBP）方法基于局部特征提取，比较图像中的像素点和图像周围的像素，然后根据比较结果对结果进行求和。在图像的本地级别，该功能的描述是，基于支持向量机（SVM），通过寻找最优分类超平面获得泛化能力和高分类能力。但是，SVM中核函数及其参数的选择更灵活，无法控制。对于基于神经网络的方法，该方法利用神经网络的学习和分类能力，直接将图像像素作为网络的输入。网络的输出可以区分哪个类属于避免复杂的特征提取。实验表明，该方法具有较强的适应性和鲁棒性。通过适当增加网络神经元的数量和训练样本的数量，可以进一步提高识别性能。

Ⅲ. 面部检测

在人脸识别之前需要人脸检测，人脸检测方法包括统计模型，支持向量机（SVM）方法，以及弹性图匹配方法。在基于参数的统计特征提取方法中，特征提取和特征点定位的核心思想是将图像特征的一部分视为一种模型信息，并训练大量样本和无特征样本的特征。（并分别训练大量的要素类样本和非要素类样本），最后构造不同的分类器用于特征提取和后续识别。本文采用简单有效的Adaboost学习算法。

Haar特征值，即矩形特征是特征矩形中的黑色像素的总和与白色像素的总和之间的差。使用传统的计算方法，有必要扫描矩形中的所有像素。采用积分图，改进算法。

如图1所示，A（x，y）表示点（x，y）的积分，S（x，y）表示点的y方向上所有原始图像的总和（x，Y）。

其中，图像（x1，y1）表示原始图像，彩色图像是该点的颜色值，对于灰度图像，其灰度值的范围是0~255。

如图2所示，有四个区域，即R1，R2，R3，R4，坐标点p1，p2，p3，p4。区域R4的像素值是A（p4） A（p1）-A（p2）-A（p3）。可以使用区域的端点的积分图来计算区域的像素值。设（x，y）是矩形的原点，w是宽度，h是高度。设SumOfRect（x，y，w，h）为区域和值。

因此，矩形特征的特征值仅与特征矩形的端点的积分图相关，而不是与图像的坐标相关。特征值可以通过计算特征矩形的端点的积分图，然后简单地加上和减去它们来获得。因此，大大提高了特征的计算速度，并且还提高了目标的检测速度。

Ⅳ.卷积神经网络

20世纪60年代，大卫·休伯尔和威塞尔发现，独特的网络结构可以有效地降低反馈神经网络的复杂性，在神经元的研究中具有局部敏感性和猫皮层方向选择。然后提出了卷积神经网络（卷积神经网络-CNN）。现在，CNN已经成为许多科学领域的热门研究课题，特别是在模式分类领域，因为它避免了图像的复杂预处理，可以直接输入原始图像，因此得到了广泛的应用。

卷积神经网络模型

卷积神经网络是一种非完全连通的多层神经网络，包含卷积层（卷积层，C）和采样层（子采样层S），整个网络的隐藏层由卷积层和子采样层组成。整个模型如图3所示。

一般来说，CNN的基本结构由两层组成，一层是卷积层，特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取局部特征。一旦提取局部特征，并确定其与其他特征的位置关系，每个层具有多个特征图（特征图），其由卷积滤波器提取，然后每个特征图具有多个神经元。

另一个是采样层，它是一个特征映射层。网络的每个计算层由多个特征图组成，并且每个特征图是平面，其中所有神经元的权重相等。

另外，由于地图上神经元的共享权重，网络的自由参数的数量减少。卷积神经网络中的每个卷积层之后是用于局部平均和二次提取的计算层。具有两次特征提取的独特结构降低了特征分辨率。

在本文中，我们在Linux系统上进行实验，基于TensorFlow（仅0.10.0 CPU）训练CNN模型。使用的网络结构如图4所示。网络设计由11层组成，包括4个卷积层，4个采样层，2个完全连接层和1个输出层。除输入外，每个层都包含训练参数（连接权重）。输入图像的大小为112 * 112，通过面部检测过程进行归一化。

TensorFlow是一个使用数据流图进行数值计算的开源软件库。它是一个将复杂数据结构传输到人工神经网络进行分析和处理的系统。它可用于许多深度学习领域，如语音识别和图像识别。

Ⅴ. 实验结果

在本文中，卷积的部分参数设置为相同。例如，卷积核的大小是3*3，步幅是1，填充相同，这意味着在卷积之前和之后图像大小不变。并且从0.1高斯采样的标准偏差初始化权重。最后两层是完全连接的层或特征图，神经元的数量分别为2048和224。权重从具有标准偏差0.1的高斯分布初始化，阈值初始化为0.1，并且以50％的概率执行丢

失。表1详述了我们的CNN架构。

我们使用的激活功能是整流线性单元（RELU）。在结果层中，有两个神经元，分别对应0和1。接下来，归一化指数函数在最后一层用于预测单个类。归一化指数回归是一种监督学习算法，它对计算方法和识别效果有很好的影响。归一化指数函数的损失函数是交叉熵损失函数（SCEL），其在（4）中描述。

训练模型的过程是不断优化模型参数的过程。我们的训练目标是找到最优模型参数theta;，它可以使损失函数J（theta;）最小。在本文中，梯度下降算法用于通过迭代获得最优解。扣除后，梯度公式如下。

在实际应用中，参数不会任意设置为0.它将被添加到权重衰减项（权重衰减）的损失函数中，权重衰减项可以保留所有参数(theta;1, theta;2,hellip;hellip;, theta;k)。同时，解决了归一化指数函数回归的参数冗余问题。在本文中，我们使用L2规则性，权重衰减系数是5*10e-4，这是L2规则系数。

在CNN结构培训中，我们从谷歌收集了包含特定目标的778张图片，其中选择了712个目标人脸图像。然后根据不同的分类切割。由于CNN的性能取决于训练数据，并且我们收集的数据量很小，我们采用阈值限幅方法，如图5所示。

每个图像被剪切出5部分，阈值设置为40 *40像素。如果原始图像大小小于阈值。它不会被裁剪。所有原始图像将与裁剪的图像一起作为正样本。裁剪数据如表2所示。

表2 裁剪数据

<td

资料编号：[4363]</td

状况	裁剪结果

您需要先支付 20元 才能查看全部内容！立即支付

注册

找回密码