图像哈希检索方法研究文献综述
2020-05-04 21:19:24
近年来,随着工业现代化和材料成型技术的发展,计算机和相关的多媒体数字设备得到了广泛的普及,互联网络正逐步深入到人们生活的每个细节。伴随其出现的是网络多媒体信息的爆炸式增长。图像作为一种最直观的数字信息已成为不可或缺的多媒体内容。如何快速有效的管理这些图像数据是一个有待解决的难题。许多研究机构和个人正在做着大量的工作。
大数据时代各种多媒体信息交错混合,图像检索是管理多媒体信息当中一个重要的环节和应用。例如,目前该技术已经应用在公安系统进行人脸图像的检索,应用在医疗诊断方面进行医学图像检索等。这些应用充分奠定了图像检索在各行各业中的重要地位。基于内容的图像检索技术是一个新型的领域,它不同于传统的互联网网页相关的检索技术,也不同于目前各大搜索引擎采用的基于文本的图像检索技术。网页检索技术与基于文本的图像检索技术采用类似的检索策略,都是通过匹配输入文本与数据库中的文本标签来检索出对应的对象,如网页、链接或图片等。从技术流程方面来讲,传统的基于文本的图像检索技术一般通过先对图像进行语义描述,语义的生成过程大部分是由上传图片的用户对其进行描述,随后采用文本匹配的方法进行搜索匹配。由于人的主观意愿可能会对同一图像有不同的理解,因此也会产生差别较大的描述,这也是目前很难解决的语义鸿沟问题,所以其检索结果往往不能令人满意。目前,各大检索网站,如谷歌、百度、雅虎等均采用这种技术。为了解决这个问题,学者们提出了图像哈希技术。一图胜千言,所以目前基于图像内容的检索正在吸引着研究者们。
20 世纪 70 年代末期,图像检索随着网络发展的潮流逐渐兴旺起来。最开始的图像检索技术采用文字匹配文字的方法,也即是说,通过匹配图像文本描述与搜索内容的方法实现,因此,对图像进行人工语义描述是最初操作步骤,然后通过匹配文本的内容来实现图像检索。该方法虽然能实现快速检索,但是对于目前呈指数增长的图像数据进行人工标注显然是不可能的,并且人的主观意愿在很大程度上影响着图像信息描述的准确性。因此,这种传统的图像检索技术仍然存在这很大的缺陷。根据以上描述,我们可以发现传统图像检索技术的不足和缺陷,因此,许多科研工作者开始致力于改善这种情况。90 年
代中期,一种基于内容图像检索——CBIR(Content-Based Image Retrieval)技术的产生正在逐渐改变这种情况。基于内容的图像检索摒弃了“文字搜文字( text-to-text )” 的 检 索 策 略 , 改 采 用 “ 图片 搜 图 片(image-to-image)”检索策略,这样的方法能够消除人工标注的不确定性。所有的图像标注工作都可以由机器自动完成,对于大规模图像像信息的过程中,图像的信息必须由图像本身获得,因此全面、准确的图像描述特征能够大大的提高检索质量。经过 20 多年的发展,目前流行的基于内容的图像检索系统主要有 QBIC(Query by image content),Virage,Photobook,Visual SEEK/Web SEEK 和 MARS(Multimedia analysis and retrievalsystem),他们分别是由 IBM 公司,virage,麻省理工多媒体实验室,哥伦比亚大学和伊利诺斯大学 Urbana-Champaign分校研发的。
基于内容的图像检索主要是采用一下三个步骤:首先,提取图像特征,如提取颜色特征、纹理特征、局部关键点特征等;其次,生成图像的描述符,此时一帧图像可由相应的描述符来表示;最后,通过计算图像间的描述符的距离来判断其相似性,并决定它们是否为近似或相同的图像。目前几乎所有的技术都是采用这三个步骤,许多研究已经致力于改善图像的特征提取和描述符生成。图像相似性的度量策略也同样吸引了大量的研究。但是,目前这些研究在检索的高效性和准确性上仍有很大的进步空间,而且可扩展性正成为一个衡量检索技术优良的重要指标。许多的方法还是只在特定的数据集上达到良好的检索效果,但是还不能做到通用。因此,基于内容的图像检索技术仍然有很大的研究价值和研究意义。{title}2. 研究的基本内容与方案
{title}为了能够处理大规模图像数据检索的问题和实现快速检索功能,本论文将高效的哈希算法应用到了图像检索当中,最终实现准确高效的实时图像检索。
本论文主要研究图像哈希的检索方法,首先对图像哈希技术的研究现状及意义进行介绍,其次对图像的相关知识进行系统的描述,主要对图像的几种特征提取进行了阐述,然后对图像哈希检索方法的流程和CBIR相关的基础知识进行介绍。接下来系统介绍图像哈希算法的概念和应用,选取了局部敏感哈希方法(LSH)、谱哈希方法(SH)、锚点图哈希方法(AGH)进行了详细的介绍与研究。通过实验对比和分析,找出各种算法各自的特点、优劣势以及适用的范围。
基于深度学习的哈希算法,凭借其强大的特征学习能力,一出现就迅速超越了基于手工设计特征的传统哈希方法。但是,目前的研究还远没有到尽头,更适合这一任务的网络结构、优化算法等都还有待进一步探索。目前来看,传统方法非但没有过时,反而可以在新的深度哈希算法研究中提供一些指导,进一步提升深度哈希算法的能力。
3. 参考文献
[1] 基于哈希编码的图像检索算法研究. 赵秦敏.电子科技大学, 2017.
[2] 基于多特征哈希的图像检索的研究. 许红昇.吉林大学, 2017.
[3] 基于哈希的图像检索研究. 李蕾. 北京交通大学, 2017.
[4] Liu X, He J, Lang B. Reciprocal Hash Tables for Nearest NeighborSearch[C] Conference on Artificial Intelligence (AAAI).2013