基于深度哈希算法的海量图像检索技术研究文献综述

2020-04-29 18:50:27

1．目的及意义

随着近年来互联网、云计算、物联网、社交媒体以及其他信息技术的迅速发展，各行业产生的数据都呈爆炸式增长趋势^[1][5]。其中，图像检索技术作为大规模数据应用的热门领域之一，传统的检索技术已经无法满足当前对大量图像检索的需要。而哈希学习是基于机器学习的方法得到图像的哈希索引，用于支持大规模图像的快速检索，能够有效解决海量图像的检索问题，具有优秀的时间与空间复杂度。因此，具备提高图像的检索效率同时减少储存空间的图像哈希算法受到广泛的关注^[4]。

哈希学习由Salakhutdinov和Hinton于2007年推介到机器学习领域^[4]，于近几年迅速发展成为机器学习领域和大数据学习领域的一个研究热点，并广泛应用于信息检索、数据挖掘、模式识别、多媒体信息处理、计算机视觉、推荐系统、以及社交网络分析等领域。哈希学习通过机器学习机制将数据映射成二进制串的形式，显著减少了数据的存储和通信开销，从而有效提高学习系统的效率。哈希学习的目的是学到数据的二进制哈希码表示，使得哈希码尽可能地保持原空间中的近邻关系, 即保相似性。主流的哈希算法将传统的基于内容的图像检索系统中提取到的高维特征通过哈希函数生成一个固定长度的二进制编码。采用哈希方法后，一幅图片将由一个固定长度的二进制编码来表示，相似度计算度量可以直接使用海明距离(HammingDistance)，计算速度大大提高，从而加快了系统的检索效率。

二进制哈希算法可以分为无监督的哈希算法、半监督的哈希算法和监督的哈希算法^[2][3]。其中，常用的无监督的哈希算法包括LSH算法，SH算法，PCA-ITQ算法等^[7]。相反地，监督的哈希算法则需要利用原始数据集的标注信息进行哈希函数的学习。监督的哈希算法包括BRE、KSH等。而半监督的哈希算法介于监督哈希算法和无监督哈希算法之间，只需要对原始数据的部分数据进行标注。比较具有代表性的SSH算法。无监督的哈希算法通过无标签的数据训练哈希函数^[9]，其中，最具有代表性的是使用随机映射构造哈希函数的局部感知哈希，它意在把相似的数据匹配到相近的二进制编码的概率最大化。然而，LSH通常需要使用较长的哈希编码才能达到令人满意的精度^[15]，这导致了较大的存储空间需求和召回率普遍偏低的问题。谱哈希是另外一个具有代表性的算法，其利用非线性函数沿着数据的主成分分析方向通过设定阈值来产生二进制编码。与无监督哈希算法相比，有监督的哈希算法通常都是数据相关的，即不具备通用性。但有监督哈希算法通常能比无监督的哈希算法学习到一个更为紧凑的编码，并且哈希的效果也比无监督的要好，大量的研究证明，使用监督信息可以提高哈希编码的学习性能。

目前主流的方法中图像特征提取与后续的哈希函数学习是分开的^[4]，即先对图像提取特征，再对所提取到的特征进行哈希函数学习。如果图像提取得到的特征并不能很好地反映图像与图像间的相似程度，那么后续的哈希函数的选择无论如何也无法满足要求。因此，如何将特征提取与哈希函数的学习结合在一起，从而提高整个检索系统的准确度十分具有研究与应用意义。

综上所述, 目前哈希学习的研究现状是：已被广泛关注并在某些应用领域取得了初步成效，但研究才刚刚开始，有的学习场景和应用领域甚至还没有研究者进行哈希学习的尝试；问题本质和模型构建有待于进一步深入思考；模型参数的优化方法有待于进一步探索；量化阶段的重要性已经引起注意，但量化策略期待进一步突破^[5]。

{title}

2. 研究的基本内容与方案

{title}

设计内容拟分为三部分，第一部分为综述，主要介绍图像检索、哈希学习、深度学习以及相关方法的研究现状和原理，并分析比较传统方法间的时间和空间效率。

第二部分为程序设计，我尝试将特征提取与哈希函数的学习结合在一起，提出一种基于深度卷积神经网络的快速图像哈希算法。图像检索的有监督哈希方法，最终会输出目标哈希函数和图像特征提取函数。求解目标哈希函数时^[4][5]，输入的相似性矩阵S被分解为H和H的转置，其中H表示训练集样本的哈希码，针对矩阵H设计了加速的求解优化算法，这一步也是我改进算法的关键。求解图像特征函数的过程中^[12]，采用了深层卷积神经网络来学习目标哈希函数以及学习一个能够更加准确地描述图像信息的表示特征，网络架构中选择了已训练好的深度卷积神经网络。输出层的构造可以简单地采用之前学习到的哈希码作为目标。在查询时，只需将图片输入到网络中，最后通过获取输出层中节点的值即可获得表达该图像的二进制哈希码。

与现有的哈希算法相比，新的方法将具有以下优点：该方法无需先对图像提取人工特征再进行哈希函数学习，而是直接通过原始图像信息和相似性信息来进行哈希函数的学习；通过运用已经训练的深度神经网络进行迁移学习，可以缩短训练时间，提高哈希函数训练的效率和效果。

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付

注册

找回密码