基于傅立叶描述子的手势特征提取与识别文献综述
2020-04-14 17:23:48
1.1 研究目的及意义
手势是人们日常生活中最广泛使用的一种交流方式。手势作为人类最自然的表达方式之一,在日常生活中得到了广泛的应用。手势生动、形象、直观,而且蕴涵着丰富的信息,是人与人沟通的重要媒介。在人机交互的发展过程中先后出现了基于文本方式的键盘、基于图形方式的鼠标等交互接,然而从某种程度上说,这些机械设备在人机交互方面是不方便和不和谐的,随着计算机科学的快速发展,研究符合人类交流习惯的人机交互技术成为国内外关注的热点,这些研究包括人脸识别、面部表情识别、头部运动跟踪、眼睛识别、手势识别以及人体姿势识别等。这些技术把机器作为人机交互的中心,在人机交互时人需要去适应机器的输入输出设备,对机器没有主动控制的能力。总体来说,人机交互的研究已经从以计算机为中心转移到以人为中心,大大提高了人机交互的效率。目前,手势识别的研究受到了越来越广泛的关注。伴随着人机交互技术的飞速发展,手势识别技术也迎来了一波高潮。
目前基于手势的交互已经成为人机交互的重要内容。手势识别的应用前景十分广阔:
(1)对于聋哑人而言,手语就是他们的语言,但是不熟悉手语的普通人来说,理解手语是非常困难的,可翻译手语的系统将大大方便聋哑人与正常人之间的交流。
(2)利用手势对虚拟现实中的智能设备进行控制。在智能穿戴、智能家居、沉浸式游戏等方面有广泛的应用前景,基于视觉的手语识别方法交互方便自然,更能反映机器模拟人类视觉的功能。
(3)智能驾驶。在2015年的CES展上,宝马展示了最新的Drive系统,其重要变化之一就是引入了手势识别功能,通过安装在车顶上的3D传感器对驾驶员手势的识别,实现对车辆导航、信息娱乐系统的控制。
1.2 国内外研究现状
根据外围设备采集手势图像方式的不同可以把手势识别分为两种:基于数据手套的手势识别和基于视觉的手势识别。最初的手势识别主要是利用机器设备直接检测手、胳膊各关节的角度和空间位置。这些设备多是通过有线技术将计算机系统与用户相互连接,使用户的手势信息完整无误地传送至识别系统中,其典型设备如数据手套。数据手套是由多个传感器件组成,通过这些传感器可将用户手的位置、手指的方向等信息传送到计算机系统中。数据手套虽可提供良好的检测效果,但将其应用在常用领域则价格昂贵,另外手套也带来很大的不方便,违背了人机交互的初衷。后来,人们采用光学标记方法取代了数据手套。将光学标记戴在人手上,通过红外线可将人手位置和手指的变化传送到系统屏幕上,该方法也可提供良好的效果,但仍需较为复杂的设备,实现多有不便。
外部设备的介入虽使得手势识别的准确度和稳定性得以提高,但却掩盖了手势自然的表达方式。为此,基于视觉的手势识别方式应运而生。视觉手势识别是指对视频采集设备拍摄到的包含手势的图像序列,通过计算机视觉技术进行处理,进而对手势加以识别。基于视觉的手势识别仅需要廉价的摄像头和低端处理能力的PC机即可。并且在操作时更加自然、方便,符合以人为本和自由性的要求,是手势识别未来发展的趋势。
国外很早就开始了对手势识别的研究工作。Huang创建的手语识别系统使用3D神经网络的方法识别了15个不同的手势。Stamert等人使用隐马尔可夫模型(HMM)对输入视频序列中的美国手势中带有词性的40个词汇随机组成的句子进行了识别,印度研究者Meenakshi Panwar在视觉手势识别的基础上提出了一种基于结构特征的手势识别算法,通过背景去除、方向检测、拇指检测和手指数量检测,来最终识别手势。此外,许多大型电子企业也将手势识别研究列入其开发项目中,并且成果显著。2012年,三星推出智能电视新品ES8000,该款电视机将面部识别,手势识别和语言识别结合,无论是通过语音还是简单的手势,用户可完成开关机、调节音量、换台、上网浏览或关键字搜索等基本操作。微软研发机构的微软研究院(Microsoft Research,MSR)与华盛顿大学合作,开发出一种可利用笔记本电脑内置麦克风和扬声器进行手势识别的技术。